0

可能重复:
如何使用 Python 从网页下载文本文件或某些对象?

我正在尝试从该网站下载“预发布域”下的文件:http://www.namejet.com/pages/downloads.aspx 因此,今天是 10 月 10 日,您想要获取文件“2012 年 10 月 10 日,星期三”。单击文件时,链接不会更改,因此我无法编写 python 代码来下载特定文件,因为我没有特定文件的特定 URL。如何编写脚本?我希望一切都发生在后端而不实际打开浏览器:

#!/usr/bin/python

from selenium import webdriver
from pyvirtualdisplay import Display
display = Display(visible=0, size=(1024, 768))
display.start()

browser=webdriver.Firefox() # Select browser that you want to automate 
browser.get('http://www.namejet.com/pages/downloads.aspx')
element=browser.find_element_by_xpath(
            '//a[@id="ctl00_ContentPlaceHolder1_hlPreRelease1"]')
element.click()
display.stop()

此代码运行没有错误,但不下载文件。我究竟做错了什么?

4

1 回答 1

1
In [1]: from selenium import webdriver
In [2]: browser=webdriver.Chrome() # Select browser that you want to automate 
In [3]: browser.get('http://www.namejet.com/pages/downloads.aspx')
In [4]: element=browser.find_element_by_xpath(
            '//a[@id="ctl00_ContentPlaceHolder1_hlPreRelease1"]')

In [5]: element.click()

现在你可以在你的下载文件夹中找到 prerelease_10-08-2012.txt 并且你可以用通常的方式打开它。

编辑:请注意,代码下载了最新的文件,即今天的 prerelease_10-10-2012.txt。刚试了一下,效果很好。

于 2012-10-10T05:28:12.960 回答