java - 怎么解码中文

Question

我正要开始解码一些我确定是中文的东西，它在数据库中看起来像这样：衡

Sybase 的编码默认是 windows-1252，但是上面是什么？我怎样才能解码它以写出中文字符。不幸的是，它被存储为 nchar 。

如果有人想知道这是如何完成的：

int i = new Integer("34913").intValue();

String s = new String(Character.toChars(i));

正如@Joachim 所说，谢谢。

score 1 · Accepted Answer

这是由 XML （以及HTML4和HTML5 ）定义的十进制数字字符引用。该数字是 Unicode 代码点的十进制表示。

只需解析数字并将其转换为 anint即可获得实际的 unicode 代码点。然后Character.toChars()用来获取对应的char值（通常只有一个，但是对于BMP之外的字符会有两个代理值）。

1 回答 1