0

存在一些真正的双字节编码(DBCS)吗?

  • 除了 UCS-2,当然还有 UTF-16。
  • 我的意思是编码,它也将 ASCII 保存为 2 个字节。
  • 我的意思是空字节。(00 20 - 空格)
  • 请告诉它是否已使用,是否在标准/使用中已过时。

4字节编码的相同问题是否存在(不是UCS-4,UTF-32)?

谢谢。

4

2 回答 2

2

肯定有一些遗留字符集为每个字符使用两个字节,但这些字符集通常根本不编码 ASCII 字符,旨在补充单字节字符集而不是替换它。我所知道的所有这些都支持中文、日文和/或韩文的表意字符。

周围有很多使用这种编码的遗留文档,我不会惊讶地发现在某些地方它们仍在新文档中使用。

如果您试图确定您的软件是否可以忽略除 UTF 之外的多字节字符编码的存在,那么恐怕您不会得到一个简单的答案。当然,您的软件可以这样做,就像它可以忽略 ISO-8859-15 以外的单字节编码一样,但只有才能确定您的程序是否能够充分发挥其作用。

于 2015-04-20T02:54:38.730 回答
1

不,没有满足您的要求列表的双字节字符集。这是因为当时的设计人员使用 7 位 ASCII 作为起点(有利于兼容性),然后在 256 字节值的上半部分放置额外的字符或多字节起始码。

类似地,对于四字节字符集,在 Unicode 甚至试图提供超过 65536 个字符之前没有严格的标准。

举个例子,中文Big5对字节 0x00 到 0x7F 使用 ASCII 定义,使用 0x81 到 0xFF 作为扩展字符的起始字节,使用 {0x40 到 0x7E,0xA1 到 0xFE} 作为第二个字节。这可以编码最多 20067 个不同的字符。

于 2015-04-20T02:38:21.293 回答