3

当 icon_strlen 在错误的字符序列上失败时,这意味着character sequences什么是我想知道的。谢谢

4

1 回答 1

4

Acharacter sequence是一系列字节。使用 UTF-8 时,并非所有字节组合都有效。

字节序列\xc2\xbc形成 Unicode 字符U+00BC,即VULGAR FRACTION ONE QUARTER使用 UTF-8 编码时的符号 (¼)。

字节序列\xe2\x88\x9c形成 Unicode 字符U+221C,即FOURTH ROOT使用 UTF-8 编码时的符号 (∜)。

UTF-8 编码的错误字符序列将是任何不适合UTF-8字节流所需模式的字节组合,例如,字节序列\xbc\xbc将是非法的,因为两个字节字符必须110xxxxx在第一个字节中但\xbc10111100写入作为位。

于 2011-06-13T11:31:05.343 回答