8

在我的环境中,我使用 Java 将结果集序列化为 XML。它基本上是这样发生的:

//foreach column of each row
xmlHandler.startElement(uri, lname, "column", attributes);
String chars = rs.getString(i);
xmlHandler.characters(chars.toCharArray(), 0, chars.length());
xmlHandler.endElement(uri, lname, "column");

XML 在 Firefox 中如下所示:

<row num="69004">
    <column num="1">10069</column>
    <column num="2">sd&#26;</column>
    <column num="3">FCVolume                      </column>
</row>

但是当我解析 XML 时,我得到了

org.xml.sax.SAXParseException:字符引用“  ”是无效的 XML 字符。

我现在的问题是:我必须替换哪些字符或者我必须如何编码我的字符,它们将是有效的 XML?

4

3 回答 3

7

我在Xml Spec中发现了一个有趣的列表:根据该列表,不鼓励使用 Character #26 (Hex: #x1A )。

也不鼓励使用以下范围内定义的字符。它们要么是控制字符,要么是永久未定义的 Unicode 字符

查看完整的范围

此代码替换字符串中的所有无效 Xml Utf8:

public String stripNonValidXMLCharacters(String in) {
    StringBuffer out = new StringBuffer(); // Used to hold the output.
    char current; // Used to reference the current character.

    if (in == null || ("".equals(in))) return ""; // vacancy test.
    for (int i = 0; i < in.length(); i++) {
        current = in.charAt(i);
        if ((current == 0x9) ||
            (current == 0xA) ||
            (current == 0xD) ||
            ((current >= 0x20) && (current <= 0xD7FF)) ||
            ((current >= 0xE000) && (current <= 0xFFFD)) ||
            ((current >= 0x10000) && (current <= 0x10FFFF)))
            out.append(current);
    }
    return out.toString();
}    

它取自Invalid XML Characters:当有效的 UTF8 并不意味着有效的 XML

但是,我仍然遇到了 UTF-8 兼容性问题:

org.xml.sax.SAXParseException: Invalid byte 1 of 1-byte UTF-8 sequence

在读取XML - 从 servlet 返回 XML 为 UTF-8之后,我只是尝试了如果我像这样设置 Contenttype 会发生什么:

response.setContentType("text/xml;charset=utf-8");

它奏效了....

于 2008-10-01T08:46:37.893 回答
2

可扩展标记语言 (XML) 1.0说:

& 符号 (&) 和左尖括号 (<) 不得以其文字形式出现,除非用作标记分隔符,或者在注释、处理指令或 CDATA 部分中。如果在其他地方需要它们,则必须分别使用数字字符引用或字符串“&”和“<”对它们进行转义。右尖括号 (>) 可以使用字符串“>”表示,并且为了兼容性,当它出现在内容中的字符串“]]>”中时,必须使用“>”或字符引用进行转义,当字符串未标记 CDATA 部分的结尾。

如果使用 CDATA,则可以跳过编码:

<column num="1"><![CDATA[10069]]></column>
<column num="2"><![CDATA[sd&]]></column>
于 2008-10-01T08:46:10.813 回答
0

您正在运行哪个版本的 JRE?萨克斯项目说:

J2SE 1.4 捆绑了旧版本的 SAX2。如何使 SAX2 r2 或更高版本可用?

于 2008-10-01T09:13:43.633 回答