我正在尝试抓取一个页面,但我有一个 UnicodeDecodeError。这是我的代码:
def soup_def(link):
req = urllib2.Request(link, headers={'User-Agent' : "Magic Browser"})
usock = urllib2.urlopen(req)
encoding = usock.headers.getparam('charset')
page = usock.read().decode(encoding)
usock.close()
soup = BeautifulSoup(page)
return soup
soup = soup_def("http://www.geekbuying.com/item/Ainol-Novo-10-Hero-II-Quad-Core--Tablet-PC-10-1-inch-IPS-1280-800-1GB-RAM-16GB-ROM-Android-4-1--HDMI-313618.html")
和错误:
UnicodeDecodeError: 'utf8' codec can't decode byte 0xff in position 284: invalid start byte
我检查了更多用户是否有相同的错误,但我想不出任何解决方案。