查看适用于 PHP 程序员的 IBM Unicode,尤其是清单 3 和 4。
在 Ubuntu Lucid 上,我从代码中得到与 IBM 相同的输出,即:
Здравсствуйте
Array
(
[1] => 65279
[2] => 1047
[3] => 1076
[4] => 1088
[5] => 1072
[6] => 1074
[7] => 1089
[8] => 1089
[9] => 1090
[10] => 1074
[11] => 1091
[12] => 1081
[13] => 1090
[14] => 1077
)
Здравсствуйте
但是,在 Windows 上,我得到了完全不同的响应。
ðùð┤ÐÇð░ð▓ÐüÐüÐéð▓Ðâð╣ÐéðÁ
Array
(
[1] => -131072
[2] => 386138112
[3] => 872677376
[4] => 1074003968
[5] => 805568512
[6] => 839122944
[7] => 1090781184
[8] => 1090781184
[9] => 1107558400
[10] => 839122944
[11] => 1124335616
[12] => 956563456
[13] => 1107558400
[14] => 889454592
)
ðùð┤ÐÇð░ð▓ÐüÐüÐéð▓Ðâð╣ÐéðÁ
除了俄语字符(在 UTF-32 中)不在 CMD.EXE shell 中呈现(因为它们在 UTF-32 而不是 Windows 自己的 UTF-16 中)这一事实之外,为什么字符值不同如此显着?