4

我有一个想要定期下载的 URL。它只能从需要 javascript 支持的登录帐户访问,因此我被迫将 Selenium 与 PhantomJS 一起使用,相信我。否则,我会为此使用 urllib,但它会给我一个登录错误。

这是一个 CSV 文件,最多 1000 行,大约 6 列。

我希望最终将此 CSV 放入列表中。有谁知道如何使用 Selenium Webdriver 下载 CSV?

非常感谢。

编辑:我只是想从 Selenium 中的 URL 下载 CSV。没有其他的。

4

2 回答 2

1

它实际上很简单。使用我在堆栈溢出中给出的另一个答案

https://stackoverflow.com/a/21871600/2423379

编辑:在无头模式下运行 Firefox

要求:

  • sudo apt-get install xvfb(或您的发行版中的等效命令)
  • pip install --user xvfbwrapper

和代码部分

from xvfbwrapper import Xvfb

vdisplay = Xvfb()
vdisplay.start()

# launch stuff inside virtual display here

vdisplay.stop()

参考:无头模式下的 Firefox-selenium

于 2014-02-19T05:12:24.127 回答
1

page_source属性呢?

browser.get("http://winterolympicsmedals.com/medals.csv")
csv_file = browser.page_source
print(csv_file)

试试这个,我的朋友。我使用 Selenium + Python + HTMLUnit,轻而易举地工作。

希望它适用于您的 PhantomJS

于 2014-07-02T00:19:55.137 回答