我在 web 收获(来自 java)中使用 xquery 处理器来解析一个 html 页面,该页面包含一个<div>
元素内的无效标签,例如<div 3px="abc">
. 例外是:
SXXP0003: Error reported by XML parser: Element type "div" must be followed by either
attribute specifications, ">" or "/>".
at org.webharvest.runtime.processors.XQueryProcessor.execute(Unknown Source)
有没有快速清理 div 预处理的方法?或者这个问题的任何解决方法?