过去我用 Python 3.2 搞砸了,但现在我面临一个关于 Python 中 utf-8 编码的有点混乱的情况。
例如,假设我有这段代码:
'א'.encode()
结果是b'\xd7\x90'
(或0xD790
),然而,这是错误的:希伯来字符 Alef 的 utf-8 编码应该是0x5D0
。
但是,使用 utf-16 作为编码会返回正确的十六进制值,前缀为0xFFFE
:
'א'.encode('utf-16')
这返回b'\xff\xfe\xd0\x05'
。
我觉得我的理解中缺少一些基本的东西,所以
用户,请帮助教育我!