1

我使用 Jsoup 获取网站。这是网络的链接:

http://www.yelp.com/search?find_desc=restaurants&find_loc=westmont%2C+il&ns=1&ls=43131f934bb3adf3#find_loc=Hinsdale,+IL&l=p:IL:Hinsdale::&sortby=rating&unfold=1

现在我正在尝试提取网络上的子页面数量。例如下图“转到页面”旁边的数字:在此处输入图像描述

不幸的是,浏览器中的“查看源代码”或 Jsoup 都无法看到这些元素。我猜这个内容是动态嵌入到网络中的。如果是这样,访问动态生成的网络的最佳方式是什么?谢谢。

4

1 回答 1

0

对于使用 AJAX/JS Libraries 技术生成内容的网站,您可能希望使用 HTMLUnit 代替(HTMLUnit 可以模拟 Javascript 事件)。JSoup 仅适用于静态 HTML,或者您可以通过 viewsource 接收的内容。

于 2013-01-25T03:39:12.633 回答