问问题
269 次
1 回答
1
我不知道,但是如果您有可能的编码列表,则可以编写一个简单的程序,例如:
for x in ENCODINGS:
for y in ENCODINGS:
try:
if 'á'.encode(x) == '‡'.encode(y):
print(x, '→', y)
except UnicodeError:
pass
这样做,在您的情况下,原始编码似乎是以下之一:
- mac_arabic
- mac_centeuro
- mac_croatian
- mac_farsi
- mac_iceland
- mac_latin2
- mac_roman
- mac_romanian
- mac_turkish
并且被误解的编码是以下之一:
- cp1250
- cp1251
- cp1252
- cp1253
- cp1254
- cp1255
- cp1256
- cp1257
- cp1258
- 帕尔莫斯
如果您生活在“西方”语言环境中,那么 mac_roman → cp1252 是最有可能的。
于 2011-09-26T05:59:45.913 回答