我正在使用 Stax 进行 Sgml 解析。Sgml 包含诸如““””之类的字符以及许多其他未替换设置 UTF-8 的字符。解析中断并引发以下异常:
javax.xml.stream.XMLStreamException: ParseError at [row,col]:[6,22]
Message: The entity "lpar" was referenced, but not declared.
我还有另一个问题,我有一些没有关闭标签的标签,例如<coolspan>
没有 a and tag 。这打破了解析。
我正在考虑创建一种方法来替换所有特殊字符并验证没有结束标签的标签。有人已经通过这样的问题,可以告诉我一个方法吗?