在我正在处理的(Java)代码中,我有时会处理格式不正确的 XML(表示为 Java String
),例如:
<root>
<foo>
bar & baz < quux
</foo>
</root>
由于这个 XML 最终需要被解组(使用 JAXB),显然这个 XML 将在解组时抛出异常。
&
将 the和 the替换<
为其角色实体的最佳方法是什么?对于&
,这很简单:
xml.replaceAll("&", "&")
但是,对于<
符号,它有点棘手,因为显然我不想替换<
用于 XML 标记开头“括号”的那个。
除了扫描字符串并<
在 XML 正文中手动替换为<
之外,您还能建议什么其他选项?