0

我需要从网页下载适合文件。我正在使用-iwget 选项执行此操作:我将下载文件存储在list.txt包含 URL1、URL2 的文件中......然后

$ wget -i list.txt

你知道是否有可能使用 Python 脚本做同样的事情?

4

3 回答 3

1

假设您的文件每行包含一个 URL,您可以这样做:

import urllib2
with open('list.txt') as my_list:
    for line in my_list:
        response = urllib2.urlopen(line)
        html = response.read()
        # now process the page's source
于 2013-02-15T11:48:57.687 回答
0

如果您获得 SSL:CERTIFICATE_VERIFY_FAILED:

import wget
import ssl

ssl._create_default_https_context = ssl._create_unverified_context
with open('list.txt') as my_list:
    for url in my_list:
        wget.download(url)

使用操作系统库:

import os

with open('list.txt') as my_list:
    for url in my_list:
        os.system('wget ' + url)
于 2018-12-03T19:24:57.210 回答
0
with open('list.txt') as my_list:
    for url in my_list:
        wget.download(url)
于 2016-09-19T12:57:30.270 回答