我目前正在用java开发一个程序,我想显示中文拼音,这是我从一个遥远的网站得到的。
但是我有以下问题:中文拼音是这样显示的:jiǎ
而应该这样显示:jiǎ
(我只是输入了相同的序列,除了我去掉了斜杠)。
我认为这个问题的答案非常简单,但我很难找到它。
问题是您有一个 HTML 编码的 Unicode 字符,而您想要的是它的解码版本。像commons-lang3(Apache Commons 的一部分)这样的库将获取您的 HTML 编码字符串并将其解码以供 Java 显示,如下所示:
String decoded = StringEscapeUtils.unescapeHtml("jiǎ");
您还可以像这样在 Java 中转义 Unicode 字符:
String jia = "ji\u01ce";
这个巧妙的单行将采用 Unicode 字符并向您显示其转义形式:
System.out.println( "\\u" + Integer.toHexString('ǎ' | 0x10000).substring(1) );