当 icon_strlen 在错误的字符序列上失败时,这意味着character sequences
什么是我想知道的。谢谢
问问题
393 次
1 回答
4
Acharacter sequence
是一系列字节。使用 UTF-8 时,并非所有字节组合都有效。
字节序列\xc2\xbc
形成 Unicode 字符U+00BC
,即VULGAR FRACTION ONE QUARTER
使用 UTF-8 编码时的符号 (¼)。
字节序列\xe2\x88\x9c
形成 Unicode 字符U+221C
,即FOURTH ROOT
使用 UTF-8 编码时的符号 (∜)。
UTF-8 编码的错误字符序列将是任何不适合UTF-8字节流所需模式的字节组合,例如,字节序列\xbc\xbc
将是非法的,因为两个字节字符必须110xxxxx
在第一个字节中但\xbc
被10111100
写入作为位。
于 2011-06-13T11:31:05.343 回答