我想编写一个代码来匹配某些单词。我不在乎这个词的形式,它可以是一个名词,加上-ing,它可以变成一个动词。例如,添加 = 添加,招募 = 招募。另外,就像招聘=招聘=招聘人员。
简而言之,单词的所有形式都是平等的。是否有任何 Java 程序可以用来实现这一点。
我对 Apache 的 OpenNLP 有点熟悉,所以这是否有帮助?
谢谢!!
我想编写一个代码来匹配某些单词。我不在乎这个词的形式,它可以是一个名词,加上-ing,它可以变成一个动词。例如,添加 = 添加,招募 = 招募。另外,就像招聘=招聘=招聘人员。
简而言之,单词的所有形式都是平等的。是否有任何 Java 程序可以用来实现这一点。
我对 Apache 的 OpenNLP 有点熟悉,所以这是否有帮助?
谢谢!!
听起来你想要一个词干分析器或词形还原器。您可能想查看包含 lemmatizer 的Stanford CoreNLP。您可能还想试试Porter Stemmer。
我的猜测是,这些将涵盖一些情况,但不是全部。例如,“recruitment”不会被词形化为“recruit”。为此,您需要一个更复杂的形态分析仪,但我不知道有一个好的现有系统。