1

我在记事本中保存了一个包含 ANSI 编码列表的文本文件。

当我尝试在 Python 中使用以下脚本显示列表时,它会显示列表中的第一项,然后给出“输出不是 utf-8”错误消息。

with open("animals.txt") as f:
    content = f.readlines()

for animal in content:
    print animal

有什么办法可以解决这个问题吗?

4

1 回答 1

3

您正在读取一个字节字符串,然后将这些原始字节直接传输到您的输出,并且您的终端或 IDE 控制台抱怨字节流包含在 UTF-8 中非法的序列。

用于codecs.open()将文件读入 unicode 数据,然后让 Python 将 unicode 值自动编码到终端编解码器:

import codecs

with codecs.open("animals.txt", 'r', encoding='mbcs') as f:
    content = f.readlines()

for animal in content:
    print animal

或直接在文件上循环:

import codecs

with codecs.open("animals.txt", 'r', encoding='mbcs') as f:
    for animal in f:
        print animal

mbcs是 Windows ANSI 代码页的 Python 名称:

仅限 Windows:根据 ANSI 代码页 (CP_ACP) 对操作数进行编码

也许您的意思是不同的、特定的 Windows 代码页;在这种情况下,请选择正确的编解码器,cp例如Microsoft 的西欧 Latin-1 变体。cp1250cp1252

于 2013-08-18T15:25:59.423 回答