0

我正在使用 Java 和 SAX 从搜索引擎实现 RSS 搜索功能。然而,一些搜索结果的格式不正确,即<title>一些条目的标签正文包含&字符而不是&amp;等(例如,比如说,Starsky & Hutch)。

解析 RSS 时,我得到一个org.apache.harmony.xml.ExpatParser&ParseException,导致整个搜索中断并且什么也不返回。

我希望我的解析器能够解决这些错误,就像 Firefox 的 RSS 阅读器一样。解决此问题和解析 RSS 提要的可能性是什么?

4

1 回答 1

1

SAX 实现通常设计用于检测错误和抛出异常,并且没有解决此问题的标准方法。我能想到的最合理的事情是在流式传输到 SAX 之前尝试修补错误,例如杂散和字符。

于 2012-03-13T17:50:16.310 回答