我正在使用 HTMLDocument 迭代器来尝试迭代 HTMLDocument 中的所有 a 标签。但是,迭代器似乎跳过了嵌套在 p 标签内的标签。例如:
<html>
<body>
<a href = "somesite"> some site </a>
<p>
<a href = "someothersite"> some other site </a>
</p>
</body>
</html>
迭代器将获得第一个 a 标签(somesite),但它不会转到 p 标签内的 a 标签(someothersite)。
这是代码:
private void getLinks() throws MalformedURLException {
HTMLDocument.Iterator it = content.getIterator(HTML.Tag.A);
it.next();
while(it.isValid()) {
// Do something
it.next();
}
}
有人可以建议为什么吗?