1
4

1 回答 1

1

我不知道,但是如果您有可能的编码列表,则可以编写一个简单的程序,例如:

for x in ENCODINGS:
    for y in ENCODINGS:
        try:
            if 'á'.encode(x) == '‡'.encode(y):
                print(x, '→', y)
        except UnicodeError:
            pass

这样做,在您的情况下,原始编码似乎是以下之一:

  • mac_arabic
  • mac_centeuro
  • mac_croatian
  • mac_farsi
  • mac_iceland
  • mac_latin2
  • mac_roman
  • mac_romanian
  • mac_turkish

并且被误解的编码是以下之一:

  • cp1250
  • cp1251
  • cp1252
  • cp1253
  • cp1254
  • cp1255
  • cp1256
  • cp1257
  • cp1258
  • 帕尔莫斯

如果您生活在“西方”语言环境中,那么 mac_roman → cp1252 是最有可能的。

于 2011-09-26T05:59:45.913 回答