我在我的公司做一个关于 Unicode 和编码的技术演讲,我试图说明字符串总是被编码的,开发人员永远不应该粗心地假设一切都是 0-127 ASCII。
我有很多由错误编码文本引起的问题示例,但我没有找到任何简单英文文本的示例,其中的数字编码高于 Unicode代码点127。
基本英文字母在 Unicode 中映射到与普通旧 ASCII 相同的数值:范围A-Z
映射到[65-90]
(或[0x41-0x5a]
十六进制),并[a-z]
映射到[97-122]
(hex [0x61-0x7a]
)。
英文字母是否出现在代码表的其他地方?我不是指回旋字母或其他拉丁变体,只是简单的英文字母。