1

严格来说,BOM 应该是一个字节序指示符(就像 UTF-16 和 UTF-32 的情况一样),但是,它可以用来指示使用的编码,就像 UTF-8 BOM 标记的情况一样( EF BB BF)。

作为一个双字节码点,BOM 可以转换为任何支持双字节码点的编码,并且可以产生不同的编码。BOM Wikipedia 页面中列出了一些示例:

UTF-1          F7 64 4C
UTF-EBCDIC     DD 73 66 73
SCSU           0E FE FF[t 4]
BOCU-1         FB EE 28
GB-18030       84 31 95 33

除了 UTF-8 BOM(这很常见并导致问题)之外,是否有任何工具或应用程序可以实际生成以此类编码特定标记开头的文件?此类标记是否存在于此类编码的文件中,可能是由于从其他编码转换的结果。这样做的实际含义:如果至少忽略并跳过它们以避免错误,那么通过应用程序在其支持的编码池中检测此类标记是否是一种好习惯。

4

0 回答 0