我在我的应用程序中使用 sax 解析器将 XML 解析为字符串。当我的代码将 HTML 正文作为字符串发送时,sax 解析器会卡住更长的时间(超过 5 小时)。
页面源网址:“ http://www.cityam.com/taxonomy/term/1/all/feed ”我想解析。此 url 提供 HTML 页面而不是 XML。如何处理此类问题或如何在适当的异常情况下从我的 saxParser 中退出。我的代码在这里
public List<RssEntry> parseDocument(String body) {
// expected body is xml but getting stuck when get body of html page.
SAXParserFactory factory = SAXParserFactory.newInstance();
try {
SAXParser parser = factory.newSAXParser();
XMLReader reader = parser.getXMLReader();
parser.parse(new ByteArrayInputStream(body.getBytes("UTF-8")), this);
}
some catch block
请帮助我。谢谢