2

我正要开始解码一些我确定是中文的东西,它在数据库中看起来像这样:衡

Sybase 的编码默认是 windows-1252,但是上面是什么?我怎样才能解码它以写出中文字符。不幸的是,它被存储为 nchar 。

如果有人想知道这是如何完成的:

int i = new Integer("34913").intValue();

String s = new String(Character.toChars(i));

正如@Joachim 所说,谢谢。

4

1 回答 1

1

这是由 XML (以及HTML4HTML5 )定义的十进制数字字符引用 。该数字是 Unicode 代码点的十进制表示。

只需解析数字并将其转换为 anint即可获得实际的 unicode 代码点。然后Character.toChars()用来获取对应的char值(通常只有一个,但是对于BMP之外的字符会有两个代理值)。

于 2012-09-17T10:38:59.800 回答