我正在使用 Saxon 9 来分析无效的 html 源。具体来说,html 的 href 值如下:
<a href="blah.asp?fn=view&g_varID=1234">一些文字</a>
我收到错误:
“XML 解析器报告的错误:对实体“g_varID”的引用必须以 ';' 结尾 分隔符。”
xml 解析器正在读取“&g_varID”字符串并抱怨应该有一个“;” 来界定实体。但是,当然,这并不是一个 HTML 实体——它只是一个 URI 的一部分。
我如何告诉解析器忽略它?注意:我使用的是非模式感知 Saxon,而不是 Saxon-SA。