我从大量 CSV 文件中捕获了大量数据。某些信息已被挖掘出来。我雕刻的一个部分是具有大量各种文本格式的部分。其中一些是情绪和其他非标准文本。
将此数据输出为 HTML 格式时,我遇到了错误。目前我有以下错误:
UnicodeDecodeError:“charmap”编解码器无法解码位置中的字节 0X90:字符映射到 <undefined>。
该程序当前将信息从字符串存储到数组中。然后将数组写入 HTML 文件。
知道如何在 Python 3.2 中克服这个问题或如何实现字符缓冲区吗?
更新
我已经尝试了下面的评论,也做了更多的研究。
我使用此代码无济于事:
MessageArray.append(Message.encode('ascii', 'ignore'))
但我得到了错误:TypeError: Cant convert 'bytes' object to str 隐式。