1

我正在尝试转义日文 xml 以显示为普通日文字符串而不是 unicode xml。我不能使用apache.commons.lang3,只有apache.commons.lang首选。如果您有任何其他建议不在此库中,请随时分享。提前致谢!

final String xmlToEscape = "言語が良くない"; final String escapedXml = StringEscapeUtils.escapeXml(xmlToEscape);

印刷:

言 ;語 ;が ;良 ;く ;な ;い ;

应该打印:

言语が良くない

4

1 回答 1

0

StringEscapeUtils.escapeXml()inapache.commons.lang 总是转义非 ASCII 字符

如果您不想转义日文字符,则只需传递字符串中的 ASCII 字符即可StringEscapeUtils.escapeXml()

package org.example;

import java.util.Arrays;

import org.apache.commons.lang.StringEscapeUtils;

public class Test {
    public static void main(String[] args) {
        // You will get "言語が良くない <ABC>"
        System.out.println(StringEscapeUtils.escapeXml("言語が良くない <ABC>"));
        // You will get "言語が良くない &lt;ABC&gt;"
        System.out.println(escapeXml("言語が良くない <ABC>"));
    }

    public static String escapeXml(String str) {
        return Arrays.stream(str.split("")).map(s -> escapeCharacter(s)).collect(StringBuilder::new, StringBuilder::append, StringBuilder::append).toString();
    }

    public static String escapeCharacter(String str) {
        if (str.matches("\\p{ASCII}")) {
            return StringEscapeUtils.escapeXml(str);
        } else {
            return str;
        }
    }
}
于 2021-05-22T20:02:02.440 回答