python - ValueError：未知的网址类型

Question

标题基本概括了所有内容。这是我的代码：

from urllib2 import urlopen as getpage
print = getpage("www.radioreference.com/apps/audio/?ctid=5586")

这是我得到的回溯错误：

Traceback (most recent call last):
  File "C:/Users/**/Dropbox/Dev/ComServ/citetest.py", line 2, in <module>
    contents = getpage("www.radioreference.com/apps/audio/?ctid=5586")
  File "C:\Python25\lib\urllib2.py", line 121, in urlopen
    return _opener.open(url, data)
  File "C:\Python25\lib\urllib2.py", line 366, in open
    protocol = req.get_type()
  File "C:\Python25\lib\urllib2.py", line 241, in get_type
    raise ValueError, "unknown url type: %s" % self.__original
ValueError: unknown url type: www.radioreference.com/apps/audio/?ctid=5586

我最好的猜测是 urllib 无法从杂乱无章的 php URL 中检索数据。如果是这种情况，是否有解决方法？如果没有，我做错了什么？

score 10 · Accepted Answer

您应该首先尝试'http://'在 url 前面添加。此外，不要将结果存储在中print，因为它会将引用绑定到另一个（不可调用的）对象。

所以这一行应该是：

page_contents = getpage("http://www.radioreference.com/apps/audio/?ctid=5586")

这将返回一个类似对象的文件。要读取其内容，您需要使用不同的文件操作方法，如下所示：

for line in page_contents.readlines():
    print line

score 3 · Accepted Answer

3

您需要传递一个完整的 URL：即它必须以 . 开头http://。

于 2012-11-30T08:56:59.147 回答

score 2 · Accepted Answer

只需使用http://www.radioreference.com/apps/audio/?ctid=5586它就可以正常工作。

In [24]: from urllib2 import urlopen as getpage

In [26]: print getpage("http://www.radioreference.com/apps/audio/?ctid=5586")
<addinfourl at 173987116 whose fp = <socket._fileobject object at 0xa5eb6ac>>

python - ValueError：未知的网址类型

3 回答 3

Related

Reference