我有一个带有西班牙语文本的 UTF-8 文件,并且某些带有重音符号的单词在某些软件中显示不正确。
我相信我的文件是正确的。例如,名称“JESÚS”编码为4A 45 53 C3 9A 53
.
>>> b'\x4A\x45\x53\xC3\x9A\x53'.decode('utf-8')
'JESÚS'
c39a
\u00da
根据http://www.fileformat.info/info/unicode/char/00da/index.htm是正确的 UTF-8 编码。
那么,为什么有些软件渲染不正确呢?