我有一个以 UTF-8 编码的文本文件。我正在阅读它以分析和绘制一些数据。我希望文件以 ascii 格式读取。最好使用编解码器模块还是使用内置的字符串解码方法?此外,文件被划分为 csv,那么 csv 模块也可以是一个有效的解决方案吗?
谢谢你的帮助。
你的意思是你的文件是用UTF-8编码的吗?(“Unicode”不是编码...必读:http ://www.joelonsoftware.com/articles/Unicode.html )我不是 100% 确定,但我认为您应该能够阅读 UTF-8使用 csv 模块编码的文件,您可以在阅读后将包含特殊字符的字符串转换为 Python 的 unicode 字符串(编辑:如果需要)。
在http://docs.python.org./library/csv.html#csv-examples有一些使用 UTF-8 编码数据的 csv 示例;它可能会帮助您查看它们。