0

我想创建一个查看文件的脚本,读取每一行(它们是 url)并为我获取 HTTP 标头。我有一个问题:我尝试将结果重定向到文本文件,但无论如何我尝试,它都不起作用。

有人可以帮我写代码吗?

import urllib.request
import sys
open('sorti.txt','w')
sorti = open("sorti.txt",'w')
print('Creation de sorti.txt')

text_file = open ("id.txt", "r")
text_file.read().strip('\n') 
for lines in text_file:
    urllib.request.urlopen('lines').write.sorti()
    header = urllib.request.parse_http_list(lines).write.sorti()
    sys.stdout(sorti)
text_file.close
sorti.close
4

1 回答 1

0

假设你正在寻找这样的东西

    URL1
    header_1: value
    ...
    header_n: value

    URL2
    header_1: value
    ...
    header_n: value

更改代码如下:

text_file = open ("id.txt", "r")
for line in text_file:
    sorti.write(line) // writes the current url
    obj = urllib.request.urlopen(line)
    headers = dict(obj.info()) // gets the headers
    for (h,v) in headers.items(): // write all with the specified format
        sorti.write("{0}: {1}\n".format(h, v))
    sorti.write("\n")
sorti.close

那些是write.sorti()行不通的。

于 2013-05-13T16:23:50.310 回答