1

目前我正在使用 python 及其 urllib2、urllib 来检索一个简单的静态网页。在网页开发人员添加 java 脚本之前,一切都很顺利。现在最有趣的信息隐藏在脚本后面:

<a href="javascript://" class="event-more-view" id="view-moreid-12311" onclick="Markets.applyView(this);return false;" treeid="1291266" eventstate ="false" > add table </a>

浏览器预加载数据并在单击“a href”链接时显示它。我的简短研究的结果是 JSOUP 和 HTMLunit。我在朝正确的方向挖掘吗?有什么缺点和优点吗?

python会有帮助吗?我应该使用Java吗?哪些软件包可以帮助处理动态内容?什么更简单?

就我而言,我必须创建某种虚拟浏览器,因为内置脚本会随着时间的推移刷新必须处理的数据。

4

1 回答 1

2

您正在朝着正确的方向挖掘。

以下是一些需要考虑的选项/工具:

也可以看看:

希望有帮助。

于 2013-07-02T11:53:19.450 回答