解析错误生成的 XML 文档时出现此错误:
org.xml.sax.SAXParseException: The value of attribute "bar" associated with an element type "foo" must not contain the '<' character.
我知道是什么导致了问题。就是这一行:
<foo bar="x<y">42</foo>
应该是
<foo bar="x<y">42</foo>
我知道这不是有效的 XML,但我的代码必须在无人看管的情况下下载和解析类似的文件,并且出于政治原因,可能无法说服供应商修复有故障的程序,尤其是当其他程序正在读取文件并容忍时这个错误。
有没有办法配置 Xerces 来容忍它?目前它将其视为致命错误。实现ErrorHandler
忽略它并不令人满意,因为文档的其余部分没有被解析。
或者,您能否建议另一个可以配置为容忍此错误的基于流的解析器?使用 DOM 解析器是不可行的,因为这些文档会达到数百兆字节。