7

我正在尝试使用 PhantomJS 从对话框下载(保存到磁盘)CSV 文件。使用 firefox 配置文件,通过设置浏览器配置文件属性将相当简单。任何建议如何在 phantomjs 中下载 excel 文件?

这是使用 Firefox 驱动程序完成的方式:

profile = webdriver.firefox.firefox_profile.FirefoxProfile()
profile.set_preference("browser.download.folderList",2)
profile.set_preference("browser.download.dir",self.opts['output_dir'])
profile.set_preference('browser.helperApps.neverAsk.saveToDisk', ('application/octet-stream,application/msexcel'))

我正在使用 Phantomjs 驱动程序:

webdriver.PhantomJS(service_args=['--ignore-ssl-errors=true','--local-storage-path=/tmp'])

并寻找一种方法来设置可以覆盖保存到磁盘并设置数据的 MIME 类型的属性。目前没有设置属性,PhantomJS 驱动程序不下载文件。

我已经阅读了有关避免对话框等的链接,但在这种情况下,它是必需的。

4

1 回答 1

0

我最近正在为类似的问题而苦苦挣扎。但是我最终切换了 Web 驱动程序,因为它提供了相对轻松地访问网络流量的能力。这意味着如果一个文件不是直接在页面上而是被转移进来,你就看不到它的幻影。有几个人在解决问题,但我发现我的大部分文件都在传输,因此我更容易使用 Web 驱动程序 + 萤火虫 + 网络导出来收集网络流量。

然而,在 phantomjs 中,非常hacky的方法是这样的:

phantomjs.exe file_to_run.js > my_log.txt

您只需将控制台内容保存到文件。但是,您可能会在文件中收到错误和其他消息。你可以清理它,因为你只是在寻找 cdv。

据我了解,PhantomJS 是有限的,因为开发人员对它应该如何做有一个非常具体的想法。例如,他们停止支持闪存。没有像在 Firefox 中那样简单的本地下载和保存文件的方式。您可以启动另一个网络浏览器并通过它下载。但是我认为最简单的方法是使用与 PhantomJS 配合得很好的 CasperJS。

使用 casperJS 下载文件的一个很好的例子可以在这里找到:casperjs 下载 csv 文件

我相信使用 casper 的主要问题是大文件没有得到很好的支持。您喜欢使用无头浏览器是否有特定原因?

于 2014-06-13T21:51:06.063 回答