Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我知道如何解析 RSS 提要,但如何阅读文章?我必须抓取网站吗?或者有没有用java解析文章的替代方法?
提前致谢
编辑:我决定使用jSoup。
那么RSS提要(大概)包含作为文章链接的URL,所以它(大概)归结为您所说的“阅读”。
如果您只需要获取它们,请使用URL.getInputStream或其他一些 HTTP 客户端库。
URL.getInputStream
如果您想显示新闻文章页面供最终用户阅读,那么您只需要在本机浏览器中打开 URL。
如果您想提取文章文本,那么是的,您确实需要使用适当的 HTML 解析器或(blech!)使用忽略 HTML 结构的 kludgey 文本模式识别来解析 HTML。