用于 UTF16-LE 和 UTF-32LE 的字节顺序标记之间似乎存在歧义。特别是,考虑一个包含以下 8 个字节的文件:
FF FE 00 00 00 00 00 00
如何判断此文件是否包含:
- UTF16-LE BOM (FF FE) 后跟 3 个空字符;或者
- UTF32-LE BOM (FF FE 00 00) 后跟一个空字符?
此处描述了 Unicode BOM:http: //unicode.org/faq/utf_bom.html#bom4但没有讨论这种歧义。我错过了什么吗?