我想从网页中提取句子(不仅仅是 html 剥离的文本)。我想知道流行的 HTML 解析库(如 Jsoup)是否支持这种功能?
谢谢,
编辑:
抱歉,如果帖子不清楚。我需要自然语言句子,所以不一定用点分隔。
谢谢大家。我刚刚找到了这个库http://alias-i.com/lingpipe/demos/tutorial/sentences/read-me.html,它似乎正是我想要的。
我想从网页中提取句子(不仅仅是 html 剥离的文本)。我想知道流行的 HTML 解析库(如 Jsoup)是否支持这种功能?
谢谢,
编辑:
抱歉,如果帖子不清楚。我需要自然语言句子,所以不一定用点分隔。
谢谢大家。我刚刚找到了这个库http://alias-i.com/lingpipe/demos/tutorial/sentences/read-me.html,它似乎正是我想要的。