我遇到了 HtmlUnit 解析器的问题,我试图从网站中获取一些 XML(使用网站的 API)对生成的 XML 进行快速解析,然后将 XML 保存到文件中(均在权限范围内) API)。(样本内容)
不幸的是,该网站¿
在某些请求的页面中返回了一个实体,虽然这是一个有效的 HTML 实体,但 HtmlUnit 在解析消息期间抛出异常:
实体“iquest”被引用,但未声明。
如何定义iquest
为有效实体?
您不能定义 ¿ 除非通过编辑您收到的数据(数据不是 XML,因为任何验证器都会显示,例如我在 google 上找到的第一个
该站点未提供有效的 XML,因此最好的方法是要求它修复 XML。
如果失败,则要么在 ¿ 上进行搜索和替换,要么添加定义实体 ¿ 的 DOCTYPE。