0

我需要从网页中提取主要新闻内容。我在互联网上搜索并找到了一个名为 Boilerpipe 的 API,可免费用于该目的http://boilerpipe-web.appspot.com/但我无法找到任何实现使用 Boilerpipe 的 java。谁能告诉我如何在 Java 中使用 Boilerpipe 来提取新闻内容或给我一些指向 java 中的实现的链接,这些实现利用 Boilerpipe 从新闻网页中提取内容?

4

2 回答 2

1

may be my answer is too late. But it's pretty simple.

 URL url = new URL("http://www.nydailynews.com/sports/baseball"); 
 ArticleExtractor ae = new ArticleExtractor();
 String content = ae.getText(url);  // this contains the final text
于 2012-06-22T13:27:32.130 回答
0

简单吧,假设你需要提取这个URL

只需在此处使用我的 BoilerPipe Alternative Web API ,我的服务是基于锅炉管的,我开发了这个是因为在原始应用程序中出现了 overquota 错误。你可以选择以 JSON 格式取回结果,只需在你的应用程序中使用它。 .

此致

于 2016-03-05T11:41:19.930 回答