0

要求是读取文件。根据一些规则,修改文本并将它们写入不同的文件。源文件为 UTF-8 格式,所有特殊字符都需要转换为 HTML 实体表示。

写了下面的代码,用来转换非ascii字符

    private String convertNonASCIIToDecimal(String ref) throws Exception
    {
    Pattern pat = Pattern.compile("[^\\p{ASCII}]");
    Matcher matcher = pat.matcher(ref);
    String temp;
    String tempSrc = ref;
    int charValue = 0;
    while (matcher.find())
    {
        temp=matcher.group();
        charValue = (int)temp.charAt(0);
        logger.debug("As:"+temp +":" +charValue);
        tempSrc=tempSrc.replaceAll(temp, "&#" + charValue + ";");
    }
    return tempSrc;
    }

我想知道,是否有更好的方法或功能可以做到这一点。将非 ascii 转换为其 HTML 实体表示。

4

0 回答 0