在我的程序中,我将 shift-jis 字符代码作为 Python 整数,我需要将其转换为相应的 utf8 字符代码(也应该是整数)。我怎样才能做到这一点?对于 ASCII,您有有用的函数 ord()/chr(),它允许您将整数转换为 ASCII 字符串,稍后您可以轻松地将其转换为 unicode。对于其他编码,我找不到类似的东西。
使用 Python 2。
编辑:最终代码。谢谢大家:
def shift_jis2unicode(charcode): # charcode is an integer
if charcode <= 0xFF:
string = chr(charcode)
else:
string = chr(charcode >> 8) + chr(charcode & 0xFF)
return ord(string.decode('shift-jis'))
print shift_jis2unicode(8140)