35

什么是 unicode 字符代码?它们与 ascii 字符有何不同?

4

2 回答 2

54

Unicode 是一种为当今使用的几乎所有语言的字符以及许多其他字符(例如数学符号)分配唯一编号(称为代码点)的方法。有很多方法可以将 Unicode 字符串编码为字节,例如UTF-8UTF-16

ASCII 仅将值分配给 128 个字符(az、AZ、0-9、空格、一些标点符号和一些控制字符)。

对于每个具有 ASCII 值的字符,Unicode 代码点和该字符的 ASCII 值是相同的。

在大多数现代应用程序中,您应该更喜欢使用 Unicode 字符串而不是 ASCII。例如,这将允许您让用户的姓名或地址中带有重音字符,并将您的界面本地化为英语以外的语言。

于 2012-04-28T07:38:48.787 回答
14

前 128个Unicode代码点与 ASCII 相同。然后他们有100,000左右。

Unicode 有两种常见格式, UTF-8对每个值使用 1-4 个字节(因此对于前 128 个字符,UTF-8 与 ASCII 完全相同)和 UTF-16,使用 2 或 4 个字节。

于 2012-04-28T07:44:53.783 回答