根据@Jens Timmerman 在这篇文章中的回答:从维基百科文章中提取第一段(Python)
我这样做了:
import urllib2
def getPage(url):
opener = urllib2.build_opener()
opener.addheaders = [('User-agent', 'Mozilla/5.0')] #wikipedia needs this
resource = opener.open("http://en.wikipedia.org/wiki/" + url)
data = resource.read()
resource.close()
return data
print getPage('Steve_Jobs')
从技术上讲,它应该可以正常运行并给我页面的来源。但这是我得到的:
任何帮助,将不胜感激..