我有一些 HTML 代码是 XSLT 转换的结果。(XML->HTML)
我想在结果 HTML 上运行另一个 XSLT 转换。(HTML->HTML)
我的问题是第一个转换可能会返回像“ <img>
”这样的未闭合标签,这意味着我无法使用 DocumentBuilder 解析结果 html,因为它使用 SAXparser,当然我的 html 文件在所有情况下都不是有效的 xml。(我得到一个例外,必须关闭以下 XY 标记。)
我想有两种解决方案。
通过关闭未关闭的标签来修复结果 HTML。
使用某种 HTML 解析器来获取有效的 org.w3c.dom.Document 并跳过像 SAX 这样的 XML 解析器。
我真的很想主要使用与第一次转换相同的方法,所以我更喜欢上述问题的一个解决方案是我找不到任何明显的第 3 方罐子可以提供帮助。(虽然我看过。)所以基本上我想知道我在这里有什么选择,这个问题有什么解决方案吗?
任何帮助将不胜感激。