1

可能重复:
Python 的 urllib2 在某些站点上不起作用

好的,我只想使用 python 访问这个 URL:http ://www.gocomics.com/wizardofid/2013/01/22

但是,每当我调用 urllib2.urlopen(' http://www.gocomics.com/wizardofid/2013/01/22 ').read() 时,都会出现 403 错误。使用 urllib,我所能做的就是阅读错误页面,但 urllib2 会引发错误。当我在 Chrome 中查看该页面时,它不会给我带来任何问题。为什么会这样,我该如何解决?谢谢!

4

1 回答 1

3

这个特定的网站需要一个“类似浏览器”的User-Agent标题,否则它将拒绝访问。

尝试添加标题,例如(例如)这样:

import urllib2

opener = urllib2.build_opener()
opener.addheaders = [('User-agent', 'Mozilla/5.0')]
urllib2.install_opener(opener)
print urllib2.urlopen('http://gocomics.com/wizardofid/2013/01/22').read()
于 2013-01-23T02:45:49.893 回答