我正在寻找将 HTML 表转换为 CSV 格式,并遇到了以下内容,这看起来很有希望(因为我也在尝试学习 Python) https://stackoverflow.com/a/16697784/838253
不幸的是,它不适用于我的样本,并且我遇到错误
UnicodeEncodeError: 'ascii' codec can't encode character u'\xa0' in position 753: ordinal not in range(128)
这似乎是将BeautifulSoup
stripped_strings
不间断空格
转换为u'\xa0'
这看起来像完全正常的 Unicode 的结果(尽管将多个
转换为单个 `u'\xa0' 似乎有点不对劲)
错误似乎来自csv
模块。为什么这不能处理标准 Unicode,最好的处理方法是什么?