要求是读取文件。根据一些规则,修改文本并将它们写入不同的文件。源文件为 UTF-8 格式,所有特殊字符都需要转换为 HTML 实体表示。
写了下面的代码,用来转换非ascii字符
private String convertNonASCIIToDecimal(String ref) throws Exception
{
Pattern pat = Pattern.compile("[^\\p{ASCII}]");
Matcher matcher = pat.matcher(ref);
String temp;
String tempSrc = ref;
int charValue = 0;
while (matcher.find())
{
temp=matcher.group();
charValue = (int)temp.charAt(0);
logger.debug("As:"+temp +":" +charValue);
tempSrc=tempSrc.replaceAll(temp, "&#" + charValue + ";");
}
return tempSrc;
}
我想知道,是否有更好的方法或功能可以做到这一点。将非 ascii 转换为其 HTML 实体表示。