来自 Emacs 23.1新闻:
*** Emacs 字符集现在是 Unicode 的超集。(它有大约四倍的代码空间,应该足够了)。
稍后还有更多详细信息:
*** 在多字节缓冲区和字符串中,字符由 UTF-8 字节序列表示。字符代码空间现在是 0x0..0x3FFFFF,没有间隙;代码点 0x0..0x10FFFF 是相同代码点的 Unicode 字符,而代码点 0x3FFF80..0x3FFFFF 是原始 8 位字节。
根据维基百科,UCS的BMP有65536 个字符,最新版本的Unicode包含超过 107000 个字符,UCS 有超过一百万个码点。0x3FFFFF 超过四百万。
可以解决哪些问题,或者拥有作为 Unicode 超集的内部字符集有什么好处?