我正在使用以下引用的代码从网站上抓取一些项目名称:
# -*- coding: cp1252 -*-
import csv
import urllib2
import sys
import time
from bs4 import BeautifulSoup
page = urllib2.urlopen('http://www.vodafone.de/privat/tarife/red-smartphone-tarife.html').read()
soup = BeautifulSoup(page)
soup.prettify()
items = soup.findAll('div', {"class": "txtBox"})
for item in items:
print unicode(item.string).encode('utf8').strip()
问题:当我运行此代码时,将打印 18 个“无”而不是 18 个项目的名称。
输出片段:
>>>
None
None
None
None
None
None
None
None
None
None