我已经搜索过,但没有找到合适的答复。
url = "http://en.wikipedia.org/wiki/Bryan_Greenberg"
opener = urllib2.build_opener()
opener.addheaders = [('User-agent', 'Mozilla/5.0')]
try:
ourUrl = opener.open(url).read()
soup = BeautifulSoup(ourUrl)
except Exception,err:
continue
dem = soup.findAll('p')
我刚刚复制了脚本的一部分。如何删除放置在标题和标题标签中的所有内容。所以它不是汤。谢谢。