0

我遇到了 HtmlUnit 解析器的问题,我试图从网站中获取一些 XML(使用网站的 API)对生成的 XML 进行快速解析,然后将 XML 保存到文件中(均在权限范围内) API)。(样本内容

不幸的是,该网站¿在某些请求的页面中返回了一个实体,虽然这是一个有效的 HTML 实体,但 HtmlUnit 在解析消息期间抛出异常:

实体“iquest”被引用,但未声明。

如何定义iquest为有效实体?

4

1 回答 1

1

您不能定义 ¿ 除非通过编辑您收到的数据(数据不是 XML,因为任何验证器都会显示,例如我在 google 上找到的第一个

该站点未提供有效的 XML,因此最好的方法是要求它修复 XML。

如果失败,则要么在 ¿ 上进行搜索和替换,要么添加定义实体 ¿ 的 DOCTYPE。

于 2010-06-28T16:53:49.720 回答