0

我的 XML 文件中有一个“'”。(它是 HTML 中 quot 的字符代码)

前任 :

< desc > blabla bla & # 39 ; 布拉布拉拉。</desc>

当我用String tmp = itemOfEvent.getFirstChild().getNodeValue()它解析它时,我在引号之前剪掉了我的文字。

我撞车了URL.encode(tmp, "UTF-8")

更好的主意?

4

3 回答 3

2

你说文本是 HTML 编码的,所以试试这个:

String fixedTmp = Html.fromHtml(tmp).toString();
于 2011-05-10T10:30:55.360 回答
1

我发现的最佳解决方案是替换坏字符

xmlString = xmlString.replaceAll(" & #39;", " \ ' ");
于 2011-05-11T15:15:06.063 回答
0

我假设您正在使用 SAXParser 解析 XML 文件?在这种情况下,请注意在解析单个元素时可以多次调用“characters()”方法(就像您的情况一样)。试试这个:

private StringBuilder temp_val;
public void characters(char[] ch, int start, int length){
    temp_val.append(ch, start, length);
}
于 2011-05-10T10:34:15.390 回答