10

我现在正在尝试将 unicode 字体转换为 android 中的 ascii。我编写了以下编码以将 unicode 字体转换为 ascii,但它失败了。因为结果转换后无法正常显示。

unicode 字体 = 'နေကောင်းပါသလား' 类似于 '\u100F\u1039\u100D'

public static String toJAVA (String zawgyi) {
    String output = "";
    char[] charArray = zawgyi.toCharArray();

    for (int i = 0; i < charArray.length; i++) {
        char a = charArray[i];
        if ((int) a > 255) {
            output += "\\u" + Integer.toHexString((int) a) + "--";
        } else {
            output += a;
        }
    }       
    return output;
}
4

1 回答 1

8

使用 java.text.Normalizer 类从 unicode 转换为 ascii。这是来自答案https://stackoverflow.com/a/2097224/931982的示例代码

String s = "口水雞 hello Ä";

String s1 = Normalizer.normalize(s, Normalizer.Form.NFKD);
String regex = Pattern.quote("[\\p{InCombiningDiacriticalMarks}\\p{IsLm}\\p{IsSk}]+");

String s2 = new String(s1.replaceAll(regex, "").getBytes("ascii"), "ascii");

System.out.println(s2);
System.out.println(s.length() == s2.length());
于 2013-03-12T08:50:37.943 回答