我正在构建一个执行以下操作的应用程序:
- 从 .txt 文件中获取主机并将它们放入列表中
- 下载每个网站的标题并将它们放入另一个列表
- 将包含特定单词的行打印到包含时间戳、特定行和属于该行的 url 的日志文件中。
一切实际上工作正常,但我似乎无法将正在检查的 url 传递给其他函数以便可以使用它。
此链接中的代码:http: //pastebin.com/630FrspN
实际上将打印日志文件中的每个条目相同的 url ...如果我将日志文件(websiteheaders,url)放入 for 循环中,它将起作用,但它会在日志文件中打印一个条目,次数与我在我的 url 中的次数一样多主机文件。
我需要以某种方式将在 for 循环中检查的“url”传递给 logfile 函数......
可能是一个简单的答案,但我似乎找不到它。提前致谢。
编辑:我认为下面的代码是最相关的。
def headerophalen(websites):
for url in websites:
try:
response = urllib2.urlopen(url)
headers = str(response.info())
websiteheaders.extend(headers.splitlines())
except urllib2.HTTPError, error:
print "Error opening URL: ", url, "HTTP Errorcode: ", error.code
continue
logfile(websiteheaders, url)