0

我有一个以 UTF-8 编码的文本文件。我正在阅读它以分析和绘制一些数据。我希望文件以 ascii 格式读取。最好使用编解码器模块还是使用内置的字符串解码方法?此外,文件被划分为 csv,那么 csv 模块也可以是一个有效的解决方案吗?

谢谢你的帮助。

4

1 回答 1

5

你的意思是你的文件是用UTF-8编码的吗?(“Unicode”不是编码...必读:http ://www.joelonsoftware.com/articles/Unicode.html )我不是 100% 确定,但我认为您应该能够阅读 UTF-8使用 csv 模块编码的文件,您可以在阅读后将包含特殊字符的字符串转换为 Python 的 unicode 字符串(编辑:如果需要)。

在http://docs.python.org./library/csv.html#csv-examples有一些使用 UTF-8 编码数据的 csv 示例;它可能会帮助您查看它们。

于 2009-01-23T20:36:12.197 回答