我正在使用 Java 中的 SAX 解析 XML 文档。
我正在使用描述不同领域研究出版物的 XML。
其中有诸如“抽象”之类的元素,简要描述了研究论文的内容。该字段允许使用基本的 HTML 格式,但我不希望 SAX 将 HTML 标签(如 i、b、u、sub、sup 等)作为真正的 XML 标签并触发 strartElement() 和 endElement( ) 元素上的事件。
有没有办法告诉 SAX 忽略一些预定义的 XML 标记集并将它们的 XML 代码按原样传递给 characters() 方法?