0

我正在尝试将 url 传递给 urllib:

# a file with a url on each line
file_object = open('file.txt', 'r').xreadlines()
for line in file_object:
    print line # to check if it is getting the correct value 
    var = urllib.urlopen(line).read()

我收到错误:

IOError: [Errno url error] unknown url type: '%22http'

我认为%22意味着一个转义的引号。

因此文件中的 url 格式为:

"http://www.test.com"

并且打印语句正在打印出来:

"http://www.test.com"

并且在"url 周围创建 's"\"" + url + "\""的目的是为 urllib 提供我认为需要的格式的 url。但似乎以某种方式保留了转义码,并且 urllib 不只是将值视为"http://www.test.com".

4

2 回答 2

1

如果您将 URL 放入包含引号的文件中,这不起作用是正常的,因为引号仅用于源代码中的文字字符串。在文件中包含引号就好像您在源代码中编写了类似"\"http://www.test.com/\"". 从文件中删除引号应该可以解决问题。

于 2013-04-06T07:51:05.533 回答
1
    file_object = open('file.txt', 'r').xreadlines()
    for line in file_object:
        print line[1:-2] # to check if it is getting the correct value 
        var = urllib.urlopen(line[1:-2]).read()

line[1:-2] - 只需在字符串的开头去掉一个字符,在字符串的末尾去掉两个

于 2013-04-06T08:02:17.577 回答