存在一些真正的双字节编码(DBCS)吗?
- 除了 UCS-2,当然还有 UTF-16。
- 我的意思是编码,它也将 ASCII 保存为 2 个字节。
- 我的意思是空字节。(00 20 - 空格)
- 请告诉它是否已使用,是否在标准/使用中已过时。
4字节编码的相同问题是否存在(不是UCS-4,UTF-32)?
谢谢。
存在一些真正的双字节编码(DBCS)吗?
4字节编码的相同问题是否存在(不是UCS-4,UTF-32)?
谢谢。
肯定有一些遗留字符集为每个字符使用两个字节,但这些字符集通常根本不编码 ASCII 字符,旨在补充单字节字符集而不是替换它。我所知道的所有这些都支持中文、日文和/或韩文的表意字符。
周围有很多使用这种编码的遗留文档,我不会惊讶地发现在某些地方它们仍在新文档中使用。
如果您试图确定您的软件是否可以忽略除 UTF 之外的多字节字符编码的存在,那么恐怕您不会得到一个简单的答案。当然,您的软件可以这样做,就像它可以忽略 ISO-8859-15 以外的单字节编码一样,但只有您才能确定您的程序是否能够充分发挥其作用。
不,没有满足您的要求列表的双字节字符集。这是因为当时的设计人员使用 7 位 ASCII 作为起点(有利于兼容性),然后在 256 字节值的上半部分放置额外的字符或多字节起始码。
类似地,对于四字节字符集,在 Unicode 甚至试图提供超过 65536 个字符之前没有严格的标准。
举个例子,中文Big5对字节 0x00 到 0x7F 使用 ASCII 定义,使用 0x81 到 0xFF 作为扩展字符的起始字节,使用 {0x40 到 0x7E,0xA1 到 0xFE} 作为第二个字节。这可以编码最多 20067 个不同的字符。