我正在使用 webdriver 来抓取网站以寻找用魔法常数装饰的链接,除了文本可能被格式化:
<a href="blah" ..><span blah>magic</span></a>
和很多层面
<a href="blah" ..><span blah>A <span blah><b>magic</b></span> evening</span></a>
我不知道它是否被格式化,或者如果是,它有多深,因为我正在搜索任意网站。
我的代码看起来像这样:
List<WebDriver> links = driver.getElements(By.tagName("a"));
for (WebElement link : links) {
List<WebElement> children = link.getElements(By.tagName("*"));
for (WebElement child : children) {
if (myPattern.matcher(child.getText()).matches()) {
System.out.println("found match!");
}
}
}
但这无法找到匹配项。
关于如何确定是否匹配的任何想法?