-3

我知道如何解析 RSS 提要,但如何阅读文章?我必须抓取网站吗?或者有没有用java解析文章的替代方法?

提前致谢

编辑:我决定使用jSoup

4

1 回答 1

2

那么RSS提要(大概)包含作为文章链接的URL,所以它(大概)归结为您所说的“阅读”。

  • 如果您只需要获取它们,请使用URL.getInputStream或其他一些 HTTP 客户端库。

  • 如果您想显示新闻文章页面供最终用户阅读,那么您只需要在本机浏览器中打开 URL。

  • 如果您想提取文章文本,那么是的,您确实需要使用适当的 HTML 解析器或(blech!)使用忽略 HTML 结构的 kludgey 文本模式识别来解析 HTML。

于 2012-10-03T23:13:05.127 回答