我正在执行一项任务,我需要在其中搜索网站并提取转化率。
如果我能够简单地匹配汇率,这将很容易捕获和提取,但我需要能够点击更新按钮并让程序搜索更新的转化率,所以我不能简单地硬编码匹配搜索。
有没有一种方法可以匹配费率之前的文本并捕获匹配之后的所有文本?
如果有更好的方法可以做到这一点,我也愿意接受建议。当我不知道确切的费率是多少时,我只需要帮助来了解如何从网站上获取费率。我只知道费率的格式以及费率在网站内的位置。
这是我到目前为止所拥有的:
String regex = "(?<=EUR'>)\\d+(?:\\.\\d*)?(?=<)";
Pattern pattern = Pattern.compile(regex);
Matcher match = pattern.matcher(?);
while (match.find()) {
System.out.println("Found a match: " + match.group(1).toString());
System.out.println("Start position: " + match.start(1));
System.out.println("End position: " + match.end(1));
}
我想我了解如何设置模式,但是如果我只知道开头和结尾将是什么而不是结尾,我不确定我应该为匹配字符串添加什么......
我需要抓住的一个例子是下面的行
<td class='rtRates'><a href='/graph/?from=USD&to=EUR'>0.772000</a></td>
我需要抓住这条线的汇率,但它会不断变化