1

我从大量 CSV 文件中捕获了大量数据。某些信息已被挖掘出来。我雕刻的一个部分是具有大量各种文本格式的部分。其中一些是情绪和其他非标准文本。

将此数据输出为 HTML 格式时,我遇到了错误。目前我有以下错误:

UnicodeDecodeError:“charmap”编解码器无法解码位置中的字节 0X90:字符映射到 <undefined>。

该程序当前将信息从字符串存储到数组中。然后将数组写入 HTML 文件。

知道如何在 Python 3.2 中克服这个问题或如何实现字符缓冲区吗?

更新

我已经尝试了下面的评论,也做了更多的研究。

我使用此代码无济于事:

MessageArray.append(Message.encode('ascii', 'ignore'))

但我得到了错误:TypeError: Cant convert 'bytes' object to str 隐式。

4

1 回答 1

0

通过关注@SilverbackNet 的评论,我能够解决我的问题。虽然这并没有解决我的整体问题,因为能够从 CSV 导入和转换原始二进制数据,但允许忽略给我带来问题的数据。

于 2012-08-03T07:04:24.443 回答