0

我正在寻找将 HTML 表转换为 CSV 格式,并遇到了以下内容,这看起来很有希望(因为我也在尝试学习 Python) https://stackoverflow.com/a/16697784/838253

不幸的是,它不适用于我的样本,并且我遇到错误

UnicodeEncodeError: 'ascii' codec can't encode character u'\xa0' in position 753: ordinal not in range(128)

这似乎是将BeautifulSoup stripped_strings不间断空格 转换为u'\xa0' 这看起来像完全正常的 Unicode 的结果(尽管将多个 转换为单个 `u'\xa0' 似乎有点不对劲)

错误似乎来自csv模块。为什么这不能处理标准 Unicode,最好的处理方法是什么?

4

1 回答 1

1

在 Python 2.7 中,该csv模块不支持 unicode,请参阅文档开头的注释。

您可以使用UnicodeWriter示例的 Unicode 编写 csv 数据。

于 2013-11-10T13:40:19.780 回答