0

我正在使用 Selenium webdriver(在 Python 中)来自动下载数千个文件。我希望将文件保存在不同的文件夹中。以下代码有效,但需要多次退出并重新启动 webdriver,这会减慢进程:

some_list = ["item1", "item2", "item3"] # over 300 items on the actual code
for item in some_list:
    download_folder = "/Users/myusername/Desktop/" + item
    os.makedirs(download_folder)
    fp = webdriver.FirefoxProfile()
    fp.set_preference("browser.download.folderList", 2)
    fp.set_preference("browser.download.manager.showWhenStarting", False)
    fp.set_preference("browser.download.dir", download_folder)
    fp.set_preference("browser.helperApps.neverAsk.saveToDisk", "text/plain")
    browser = webdriver.Firefox(firefox_profile = fp)

    # a bunch of code that accesses the site and downloads the files

    browser.close()
    browser.quit()

因此,在每次迭代中,我都必须退出 webdriver 并重新启动它,这非常低效。有一个更好的方法吗?显然,在 webdriver 实例化后我们无法更改 Firefox 配置文件(请参阅这个这个以前的问题),但也许我缺少一些替代方案?

(Mac OS X 10.6.8、Python 2.7.5、Selenium 2.2.0)

4

1 回答 1

1

不,我认为你做不到。

选项一:为一个 FirefoxProfile 指定不同的默认目录

你不能。在我看来,这是 Firefox 的问题,而不是 Selenium。但是,这个 Firefox 限制对我来说似乎是正确的设计。browser.download.dir是默认的下载目的地,如果它允许多个目录,那么这不再是“默认”了。

方案二:为一个驱动实例切换多个 FirefoxProfile

如果不在 Firefox 中这样做,可以为相同的驱动程序实例切换 FirefoxProfile 吗?据我所知,答案是否定的。(您已经对此进行了一些研究)

选项三:使用普通的非 Selenium 方式进行下载

如果您想避免使用这种自动下载方法并以正常方式进行(如 Auto-it 等),那么它属于“如何使用 Selenium 下载文件以及为什么不应该”的类别。但在这种情况下,您的代码可以简化。

some_list = ["item1", "item2", "item3"] # over 300 items on the actual code
for item in some_list:
    download_folder = "/Users/myusername/Desktop/" + item
    some_way_magically_do_the_downloading(download_folder)
于 2013-08-08T00:15:26.093 回答