1

我现在正在开发一个网页爬虫,不幸的是该网站通过ajax生成结果。根据一些编码人员的建议,我尝试使用 selenium,这是一个用于 python 的测试自动化工具。作为文档中给出的示例

driver = webdriver.Firefox()

执行此代码以打开 Firefox 浏览器。然后做一些事情,比如填写表格、提交等等。

坦率地说,这个例子在我的 PC(ubuntu 12.10)上运行良好,但我的项目最终会转移到 CentOS 服务器上。

我正在考虑的是代码(需要打开浏览器 gui)是否可以通过 ssh 在 CentOS 服务器上成功运行,因为该机器上没有提供诸如 gnome 之类的 KDE .....

如果没有浏览器 gui,代码无法正常运行,那么还有其他解决方案吗?

任何回复都会被佩服~

4

1 回答 1

0

如果启用 javascript,您可能可以使用HtmlUnit 驱动程序。唯一可以确定的方法是测试它。另一种选择是尝试使用 X 帧缓冲区运行。

于 2013-10-09T07:20:43.060 回答