嗨,我有一些类似的东西:
from BeautifulSoup import BeautifulSoup as bs
import urllib2
url = 'http://www.blah.com'
soup = bs(urllib2.urlopen(url))
for link in soup.findAll('a', href=True):
print link
所以问题是网站同时使用href和HREF(大写)作为链接。此脚本仅提取 href。我将如何修改代码并获得 HREF 的链接?
谢谢