2

我想从网页中提取句子(不仅仅是 html 剥离的文本)。我想知道流行的 HTML 解析库(如 Jsoup)是否支持这种功能?

谢谢,

编辑

抱歉,如果帖子不清楚。我需要自然语言句子,所以不一定用点分隔。

谢谢大家。我刚刚找到了这个库http://alias-i.com/lingpipe/demos/tutorial/sentences/read-me.html,它似乎正是我想要的。

4

2 回答 2

1

JSoup确实提供了非常方便API提取操作 data,简而言之......是的,它确实提供了这个功能......

于 2012-09-21T12:18:56.083 回答
-1

您可以为此使用 jquery

var t = $('p').text();
var sentences = t.split('.');

于 2012-09-21T12:22:46.020 回答