2

我想要一种快速的方法来检索给定 URL 的页面,但不仅获取简单的 HTML,还获取执行 javascript 后的 HTML。

我知道CutyCapt,但对我来说它很慢,某些网页需要超过 10 秒。此外,我不习惯使用 --min-wait 选项,因为它可以返回空/非最终 HTML。此外,它似乎不时提供不同的 HTML。有时它会呈现由 javascript 函数创建的元素,有时则不会。

有其他选择吗?我想提供一个 URL 并取回呈现的 html。

4

1 回答 1

1

您可以从 svn 存储库中获取当前版本的 CutyCapt 并使用 Qt 4.7.1 (或来自Qt git 存储库的主干版本)编译它。当前的 Webkit 实现比在编译版本中使用的版本 4.4.0 更快CutyCapt. 如果它仍然不够快,您可以分析代码并尝试找出它是否可以优化。

于 2010-12-26T10:01:22.583 回答