我想要一种快速的方法来检索给定 URL 的页面,但不仅获取简单的 HTML,还获取执行 javascript 后的 HTML。
我知道CutyCapt,但对我来说它很慢,某些网页需要超过 10 秒。此外,我不习惯使用 --min-wait 选项,因为它可以返回空/非最终 HTML。此外,它似乎不时提供不同的 HTML。有时它会呈现由 javascript 函数创建的元素,有时则不会。
有其他选择吗?我想提供一个 URL 并取回呈现的 html。
我想要一种快速的方法来检索给定 URL 的页面,但不仅获取简单的 HTML,还获取执行 javascript 后的 HTML。
我知道CutyCapt,但对我来说它很慢,某些网页需要超过 10 秒。此外,我不习惯使用 --min-wait 选项,因为它可以返回空/非最终 HTML。此外,它似乎不时提供不同的 HTML。有时它会呈现由 javascript 函数创建的元素,有时则不会。
有其他选择吗?我想提供一个 URL 并取回呈现的 html。
您可以从 svn 存储库中获取当前版本的 CutyCapt 并使用 Qt 4.7.1 (或来自Qt git 存储库的主干版本)编译它。当前的 Webkit 实现比在编译版本中使用的版本 4.4.0 更快CutyCapt. 如果它仍然不够快,您可以分析代码并尝试找出它是否可以优化。