0

我正在使用 Java 中的 SAX 解析 XML 文档。
我正在使用描述不同领域研究出版物的 XML。
其中有诸如“抽象”之类的元素,简要描述了研究论文的内容。该字段允许使用基本的 HTML 格式,但我不希望 SAX 将 HTML 标签(如 i、b、u、sub、sup 等)作为真正的 XML 标签并触发 strartElement() 和 endElement( ) 元素上的事件。

有没有办法告诉 SAX 忽略一些预定义的 XML 标记集并将它们的 XML 代码按原样传递给 characters() 方法?

4

1 回答 1

0

我怀疑不是,没有一些工作。当您遇到不同的元素时,我可能会插入不同的 SAX 处理程序,并将它们从堆栈中推送/弹出。因此,当您遇到一个<abstract>元素时,您将插入一个 SAX 解析器委托给的新处理程序,该处理程序足够智能,可以根据需要处理您的 HTML 元素。恐怕不是一个简单的解决方案。

于 2010-02-15T21:35:12.503 回答