utf-8 - 字符编码交叉引用

翻译自：https://stackoverflow.com/questions/7548842 2011-09-25T21:44:57.350

269 次

1 回答 1

我不知道，但是如果您有可能的编码列表，则可以编写一个简单的程序，例如：

for x in ENCODINGS:
    for y in ENCODINGS:
        try:
            if 'á'.encode(x) == '‡'.encode(y):
                print(x, '→', y)
        except UnicodeError:
            pass

这样做，在您的情况下，原始编码似乎是以下之一：

mac_arabic
mac_centeuro
mac_croatian
mac_farsi
mac_iceland
mac_latin2
mac_roman
mac_romanian
mac_turkish

并且被误解的编码是以下之一：

cp1250
cp1251
cp1252
cp1253
cp1254
cp1255
cp1256
cp1257
cp1258
帕尔莫斯

如果您生活在“西方”语言环境中，那么 mac_roman → cp1252 是最有可能的。

于 2011-09-26T05:59:45.913 回答

utf-8 - 字符编码交叉引用

1 回答 1

Related

Reference