python - Python编码类型错误

翻译自：https://stackoverflow.com/questions/13843185 2012-12-12T15:35:45.423

153 次

我正在使用 beautifulsoup 和 lxml 来解析 html 页面。一开始我使用以下代码

for item in soup.find_all("td", { "class" : re.compile(r"^(s|sb)$") }):
    data_item = (''.join(str(item.find(text=True)))).strip().lower();

我收到以下错误

 data_item = (''.join(str(item.find(text=True)))).strip().lower();
 UnicodeEncodeError: 'ascii' codec can't encode character u'\u2019' in position 24: ordinal not in range(128)

从这个线程，我将我的代码更改为以下

for item in soup.find_all("td", { "class" : re.compile(r"^(s|sb)$") }):
      data_item = u' '.join(item.find(text=True)).encode('utf-8').strip().lower();

我收到以下错误

data_item = u' '.join(item.find(text=True)).encode('utf-8').strip();
TypeError

我应该怎么办？

python - Python编码类型错误

0 回答 0

Related

Reference