4

我在读取带有 DTD 声明的 XML 文件时遇到问题(外部声明已解决)。我正在使用 SAX 方法 (javax.xml.parsers.SAXParser)。当没有 DTD 定义解析时,例如 StartEement-Characters-StartElement-Characters-EndElement-Characters...... 所以在 Start 或 End 元素之后立即调用了 characters 方法,这就是我需要的方式。当 DTD 在文件解析模式更改为例如 StartElement-StartElement-StartElement-Characters-EndEement-EndEement-EndEement 时。而且我需要在每个元素之后使用 Characters 方法。所以我问有没有办法防止解析模式的改变?

我的代码:

SAXParserFactory factory = SAXParserFactory.newInstance();   
factory.setValidating(false);  

SAXParser parser = factory.newSAXParser();
XMLReader reader = parser.getXMLReader(); 

reader.setFeature("http://xml.org/sax/features/validation", false);
reader.setFeature("http://apache.org/xml/features/nonvalidating/load-dtd-grammar", false);
reader.setFeature("http://apache.org/xml/features/nonvalidating/load-external-dtd", false);
reader.setFeature("http://xml.org/sax/features/external-general-entities", false);
reader.setFeature("http://xml.org/sax/features/external-parameter-entities", false);
reader.setFeature("http://xml.org/sax/features/use-entity-resolver2", false);   
reader.setFeature("http://apache.org/xml/features/validation/unparsed-entity-checking", false);
reader.setFeature("http://xml.org/sax/features/resolve-dtd-uris", false);
reader.setFeature("http://apache.org/xml/features/validation/dynamic", false);
reader.setFeature("http://apache.org/xml/features/validation/schema/augment-psvi", false);

reader.parse(input);

我正在尝试解析链接的 XML 文件(它在我的保管箱上的链接)。

4

1 回答 1

4

我怀疑以前报告给characters()回调的节点现在正在报告给ignorableWhitespace()回调。最简单的解决方案可能是简单地调用characters()from ignorableWhitespace()

这就是规范必须说的ignorableWhitespace()

验证解析器必须使用此方法来报告元素内容中的每个空白块(请参阅W3C XML 1.0 建议,第 2.10 节):如果非验证解析器能够解析和使用内容模型,它们也可以使用此方法。

换句话说,如果存在 DTD,并且您没有进行验证,则取决于解析器是否使用characters()回调或 ignorableWhitespace()回调报告纯元素内容模型中的空白。

于 2012-04-21T17:10:20.240 回答