我制作了一个脚本,使用 BeautifulSoup 从服务器下载几页。我正在将输出写入 .csv 文件。我正在使用 python 2.7.2
我在某些时候收到以下错误:
Traceback (most recent call last):
File "parser.py", line 114, in <module>
c.writerow([title,description,price,weight,category,subcategory])
UnicodeEncodeError: 'ascii' codec can't encode character u'\xb7' in position 61: ordinal not in range(128)
我正在下载的页面(我检查了确切的页面)似乎没有任何奇怪的字符。
我尝试了类似问题的一些解决方案。我试过这样解码:
content.decode('utf-8','ignore')
但它没有用。
正如Python 和 BeautifulSoup 编码问题中所指出的那样。我检查了网站来源,它也没有任何指定的元数据。我还尝试按照如何在 python 中下载具有正确字符集的任何(!)网页中的建议使用“chardet” ?但是 urlread() 方法似乎不起作用。我尝试使用 urlopen() ,但它崩溃了。
我该如何进行呢?