2

我正在尝试从此页面中提取以 R 开头的单词(动词) 。但是在执行以下代码时:

from bs4 import BeautifulSoup
import urllib2
url = "http://www.usingenglish.com/reference/phrasal-verbs/r.html"
content = urllib2.urlopen(url).read()
soup = BeautifulSoup(content)
print soup.prettify()

抛出的错误是这样的:

UnicodeEncodeError:“charmap”编解码器无法在位置 57801 编码字符 u“\xa9”:字符映射到未定义

有人可以告诉我错误是什么以及如何修复和继续吗?

4

1 回答 1

7

如果您向我们展示整个堆栈跟踪,或者至少向我们展示它指向的那一行,那会容易得多。

无论如何,我敢打赌,问题出在最后一行。将其更改为:

print(soup.prettify().encode('utf-8'))
于 2013-06-12T08:55:09.327 回答