0

我知道 BOM 用于 UTF-8 文件,但是对于每个字符都是 2 字节的文本文件,我是否也应该向它们添加字节顺序标记?

4

1 回答 1

5

BOM 是为 UCS-2 和 UTF-16 发明的,后来才被 Microsoft(然后是 XML)用于 UTF-8。想想名字:'字节顺序标记'。UTF-8 只有一种可能的字节顺序,因此不需要 BOM 来显示顺序。相反,UTF-8 中 U+FEFF 的三字节序列已成为文件类型嗅探的 Unicode 签名。

但是,尽管 XML 标准中包含了 UTF-8 BOM,Java 中早期版本的 XML 支持对 UTF-8 BOM 的响应并不好。此外,不能简单地将具有 BOM 的文件连接到另一个文件,因为 U+FEFF 不是文件中间的 BOM;它是 ZWNBSP。

于 2012-10-08T14:52:19.297 回答