1

我想要一些帮助,以便在我的 Java 应用程序中使用 Lucene 来简化文本。

我自己已经做过了,但我没有动词和复数的解决方案。

我该如何处理?

4

1 回答 1

0

如果我正确理解您的问题,您想从文本中检测名词/动词。AFAIK Lucene 本身无法检测到这一点。您可以改为查看OpenNLP库,它是一个

基于机器学习的自然语言文本处理工具包

因此,它将使用诸如训练模型之类的概念,然后进行预测。它有一个 POSTagger API(词性标注器)——您可以在 docs 中 查看它的用法,并在此处此处此处查看一些详细示例。

Java 中另一个优秀的框架是Stanford Core NLP你可以在这里查看Stanford Log-linear Part-Of-Speech Tagger

于 2017-08-06T19:43:26.910 回答