我正在尝试为具有属性的所有链接解析网站nofollow
。我想打印那个列表,一个一个链接。但是我未能将结果附加findall()
到我的列表中box
(我的尝试在括号中)。
我做错什么了?
import sys
import urllib2
from BeautifulSoup import BeautifulSoup
page = urllib2.urlopen(sys.argv[1]).read()
soup = BeautifulSoup(page)
soup.prettify()
box = []
for anchor in soup.findAll('a', href=True, attrs = {'rel' : 'nofollow'}):
# box.extend(anchor['href'])
print anchor['href']
# print box