在记事本中将文本文件另存为“Unicode”是什么意思?是 Utf-8、Utf-16 还是 Utf-32?提前致谢。
问问题
38212 次
2 回答
34
在记事本中,就像在一般的 Windows 软件中一样,“Unicode”作为编码名称意味着 UTF-16 Little Endian (UTF-16LE)。(我一开始以为它不是真正的UTF-16,因为Notepad++将其识别为UCS-2并将内容显示为垃圾,但是用BabelPad重新检查,我得出结论,Notepad甚至可以正确编码非BMP字符。)
同样,“Unicode big endian”表示 UTF-16 Big Endian。而“ANSI”是指系统的本机遗留编码,例如西方版本的Windows 中的8 位windows-1252 编码。
于 2012-12-15T18:40:54.427 回答
-4
所有这些格式都是“Unicode”。但通常 Mac 和 Windows 上的编辑器表示 UTF-8,因为它与代码 128 IIRC 以下的 ASCII 兼容。通过使用特殊字符,UTF-8 可以表示比 256(适合 8 位的单个字节)更多的代码,这意味着后面的字节也属于同一个字符。
如果您查看终端中的输出,例如使用 vi,并且如果您看到每两个字符之间有一个空格,那么您正在查看 UTF-16,因为每两个字节组成一个字符。您应该看到的是字符之间没有空格,这是 UTF-8 的指示。
于 2012-12-15T18:27:43.790 回答