我最近使用 Python 的 BeautifulSoup 库抓取了一堆元数据。我将该元数据中包含的所有 url 保存到一个 .txt 文件中。但是,我需要所有的重定向网址。我可以一次做一个网址:
def get_redirect_url(url):
opener = urllib2.build_opener(urllib2.HTTPRedirectHandler)
request = opener.open(url)
return request.url
print get_redirect_url("www.foo.com")
print ""
我试图将文本文件传递到一个列表中,然后将该列表作为参数传递,我收到以下错误:“TypeError:get_redirect_url() 只需要 1 个参数(给定 11 个)”
def get_redirect_url(url):
opener = urllib2.build_opener(urllib2.HTTPRedirectHandler)
request = opener.open(url)
return request.url
with open ('openCRS_url.txt', 'r') as myFile:
data = [line.strip() for line in myFile]
print get_redirect_url(*data)
print ""
有没有一种方法可以将文本文件或来自该文本文件的数据的列表表示形式作为函数的参数传递,遍历文件并提取所有重定向 url?谢谢你们。