我有一个复杂的屏幕抓取脚本,它使用 Selenium2、Selenium Web 驱动程序和 PHP 绑定脚本,所以最后,我有一个驱动 Selenium 的 PHP 脚本,它反过来获取一个 URL ,解析一些 Javascript,填写表格,等等等等,然后返回最终是我所追求的 HTML。这一切都在我的本地计算机上运行良好(作为开发和概念验证环境)。
所以。
对于生产,我需要这个脚本每天自动运行 3 次。我想弄清楚在我的服务器上设置所有东西对我来说是否更好(意思是:弄清楚如何让 Firefox for Linux 运行,然后是 Java,然后是 Selenium2 等等……对我来说不是微不足道的;该死的吉姆,我是一名程序员,而不是系统管理员!),或者我是否可以使用像Sauce Labs 的 OnDemand这样的第 3 方 Selenium 测试服务,或者任何其他基于云的 Selenium 服务。
那些第 3 方解决方案似乎都是为“单元测试”而设置的,这完全不是我正在做的。我不知道那些东西,或者使用 PHPUnit,或者用构建进行测试,或者其他什么。我只想每天运行 3 次简单的 PHP 脚本,并让它与 Selenium 对话以驱动浏览器并进行屏幕抓取。
这些第 3 方解决方案之一对于我想要完成的事情是一个好主意,还是它们是否过度杀伤/离我的(相对简单的)目标太远了?