1

是否有任何 Web API 接受 URL 并返回该页面的可读内容?或者是否有任何 javascript 库可以做到这一点?

无法安装 node.js 或任何服务器端应用程序。

4

2 回答 2

1

这实际上是一个非常困难的问题。此类问题通常意味着您希望排除侧边栏和类似的“噪音”元素。这通常通过机器学习计算机领域内的不同训练集来解决,而且开发起来并不容易。

话虽如此 - 看看:

这应该可以帮助您充分了解空间,以便更好地搜索您的问题域。

于 2013-01-01T13:08:28.937 回答
0

我想你可以在 Mashape (http://www.mashape.com/) 上找到一些相关的服务。

搜索“文本”。像这样:https ://www.mashape.com/search?query=text

那里有几个 NLP / 分析提供商,其中大多数是免费增值的。

OTOH,还有一个名为boilerpipe的项目。您可以在以下 URL 测试其质量:

http://boilerpipe-web.appspot.com/

于 2013-01-01T13:15:12.550 回答