1

我正在使用 HTMLDocument 迭代器来尝试迭代 HTMLDocument 中的所有 a 标签。但是,迭代器似乎跳过了嵌套在 p 标签内的标签。例如:

<html>
  <body>
    <a href = "somesite"> some site </a>
        <p>
            <a href = "someothersite"> some other site </a>
        </p>
  </body>
</html>

迭代器将获得第一个 a 标签(somesite),但它不会转到 p 标签内的 a 标签(someothersite)。

这是代码:

private void getLinks() throws MalformedURLException {
    HTMLDocument.Iterator it = content.getIterator(HTML.Tag.A);           
    it.next();
        while(it.isValid()) {
            // Do something
            it.next();
        }
}

有人可以建议为什么吗?

4

1 回答 1

0

也许isValid()检查会打破你的循环。尝试迭代器是否在没有该检查的情况下命中第二个锚标记。

于 2012-10-11T07:52:13.630 回答