4

我的最终目标是构建一个能够下载网页上所有图像的网络爬虫。从我所做的阅读中我的理解是我需要嵌入一个渲染/布局引擎,例如 Gecko 或 Webkit。

不幸的是,我正在运行 Windows,所以PyWebkit 已经出局,并且短期学习 C++ for Gecko 或 Java 以使用 Rhino,我不知道该转向哪里。

是否有可以在 Windows(64 位,Windows 7)中工作的具有 python 绑定的可靠渲染引擎?有没有一种简单的方法可以在 Windows 上的 python 脚本中执行 javascript?

4

1 回答 1

3

你不需要 Webkit 来做到这一点。你只需要一个引擎来运行 Javascript 代码,所以看看Gogole V8Mozilla SpiderMonkey

如果你更喜欢 Python 来构建你的爬虫,你可能想要使用PyV8,因为它提供了所有必要的绑定。

于 2011-02-14T23:41:08.700 回答