我的 XML 文件中有一个“'”。(它是 HTML 中 quot 的字符代码)
前任 :
< desc > blabla bla & # 39 ; 布拉布拉拉。</desc>
当我用String tmp = itemOfEvent.getFirstChild().getNodeValue()
它解析它时,我在引号之前剪掉了我的文字。
我撞车了URL.encode(tmp, "UTF-8")
更好的主意?
你说文本是 HTML 编码的,所以试试这个:
String fixedTmp = Html.fromHtml(tmp).toString();
我发现的最佳解决方案是替换坏字符
xmlString = xmlString.replaceAll(" & #39;", " \ ' ");
我假设您正在使用 SAXParser 解析 XML 文件?在这种情况下,请注意在解析单个元素时可以多次调用“characters()”方法(就像您的情况一样)。试试这个:
private StringBuilder temp_val;
public void characters(char[] ch, int start, int length){
temp_val.append(ch, start, length);
}