0

我正在从某个网站检索数据。内部只有在页面完全加载后才可用iejavascript将<a>标签添加到页面。<sup><a>

<table>
<tr>
<td class="left ">
<a href="reference" >Refer</a>see this
<sup class="super"><a href=​"#src1" onclick=​"dosomething;​" title=​"1" >​1​&lt;/a>​&lt;/sup>
</td>
<td class="td_right2" style="padding-top: .25em"></td>
</tr>
..

</table>

所以,当我这样做时

Document doc=JSoup.connect(...).userAgent(...).get();

该文档不包含<a>标签。如何确保文档也填充了“a”标签。Jsoup 中是否有任何类似于.readyJQuery 的功能?

4

1 回答 1

0

Jsoup 是一个 HTML 解析器,而不是一个网络浏览器。与大多数 HTML 解析器一样,Jsoup 不执行任何 JavaScript 代码。

您需要一个可以执行 JavaScript 的 HTML 解析器。HtmlUnit就是这样一个,它是一个无 GUI 的网页浏览器,专为单元测试目的而设计,并且能够执行网页中包含的可能修改 HTML DOM 树的 JavaScript。您可以尝试改用它。

于 2012-07-01T03:46:57.583 回答