我正要开始解码一些我确定是中文的东西,它在数据库中看起来像这样:衡
Sybase 的编码默认是 windows-1252,但是上面是什么?我怎样才能解码它以写出中文字符。不幸的是,它被存储为 nchar 。
如果有人想知道这是如何完成的:
int i = new Integer("34913").intValue();
String s = new String(Character.toChars(i));
正如@Joachim 所说,谢谢。
这是由 XML (以及HTML4和HTML5 )定义的十进制数字字符引用 。该数字是 Unicode 代码点的十进制表示。
只需解析数字并将其转换为 anint
即可获得实际的 unicode 代码点。然后Character.toChars()
用来获取对应的char
值(通常只有一个,但是对于BMP之外的字符会有两个代理值)。