python - 以“原始”格式输出字符串数据

Question

我从大量 CSV 文件中捕获了大量数据。某些信息已被挖掘出来。我雕刻的一个部分是具有大量各种文本格式的部分。其中一些是情绪和其他非标准文本。

将此数据输出为 HTML 格式时，我遇到了错误。目前我有以下错误：

UnicodeDecodeError：“charmap”编解码器无法解码位置中的字节 0X90：字符映射到 <undefined>。

该程序当前将信息从字符串存储到数组中。然后将数组写入 HTML 文件。

知道如何在 Python 3.2 中克服这个问题或如何实现字符缓冲区吗？

更新

我已经尝试了下面的评论，也做了更多的研究。

我使用此代码无济于事：

MessageArray.append(Message.encode('ascii', 'ignore'))

但我得到了错误：TypeError: Cant convert 'bytes' object to str 隐式。

score 0 · Accepted Answer

通过关注@SilverbackNet 的评论，我能够解决我的问题。虽然这并没有解决我的整体问题，因为能够从 CSV 导入和转换原始二进制数据，但允许忽略给我带来问题的数据。

1 回答 1