如果我正确理解您的问题,您想从文本中检测名词/动词。AFAIK Lucene 本身无法检测到这一点。您可以改为查看OpenNLP库,它是一个
基于机器学习的自然语言文本处理工具包
因此,它将使用诸如训练模型之类的概念,然后进行预测。它有一个 POSTagger API(词性标注器)——您可以在 docs 中 查看它的用法,并在此处、此处和此处查看一些详细示例。
Java 中另一个优秀的框架是Stanford Core NLP你可以在这里查看Stanford Log-linear Part-Of-Speech Tagger