4

我看到了类似的问题,但对他们的回答没有帮助。这段代码:

with codecs.open( sourceFileName, "r",  sourceEncoding, ) as sourceFile:
    contents = sourceFile.read()

with codecs.open( sourceFileName, "w", "utf-8") as targetFile:
    if contents:
        targetFile.write(contents)

返回错误“UnicodeDecodeError:'charmap'编解码器无法解码位置 1 的字节 0x98:字符映射到未定义”

这段代码:

with open(sourceFileName, "rb") as sourceFileBin:
    contents = sourceFileBin.read().decode(sourceEncoding)

with open(sourceFileName, "wb") as targetFile:
    targetFile.write( contents.encode("unt-8"))

产生相同的错误。麻烦的符号是西里尔字母“И”(据我所知,它由“0xc8”而不是“0x98”表示)。我在 Windows 上使用 python 2.7。

UPD:原来,原始文件编码可能不是 cp1251,这些错误可能是文本编辑器中的错误的结果。但是,我所有的文本编辑器都可以正确读取此文件。然后我正在寻找一些解决方法,因为没有这个特定字母的文件被正确转换。

4

1 回答 1

3

我发现由于某种错误(或者只是我的愚蠢),我试图转换已经转换的文件。

非常抱歉浪费了你的时间

于 2013-11-12T15:32:07.057 回答