1

由于 Java 在内部以 UTF-16 保存字符,如果您需要以某种编码输出,其中包括根本不是 unicode 的字符,该怎么办?

4

1 回答 1

1

基本上,Java 只能处理 Unicode 中存在的字符。BMP 之外的文本(即高于 U+FFFF)被编码为代理对(因为每个char都是 UTF-16 代码单元)...但是如果您想要根本不在 Unicode 中的字符,您就得靠自己了- 你可能会找到一些保留供私人使用的 Unicode 区域,并将字符映射到那里......但你可能会以各种奇怪的方式获得“乐趣”。

肯定需要处理不是 Unicode 的字符吗?我以为这些天几乎涵盖了所有内容...

于 2012-11-19T20:16:43.903 回答