-3

我有一个简单的项目需要实现这种事情。

Sports - > Sport
Walking -> Walk

and ideally also do things like:

good -> better
better -> good 
person -> people
people -> person

有人可以指出可以实现这一目标的最轻量级的库吗?(我知道有像 Lucene、CoreNLP 等这样的库。)但是这些都非常重,我真的只需要一个词干分析器/词法分析器

谢谢!

4

1 回答 1

2

如果您对粗略的结果(如updates-> updat)感到满意,并且权重至关重要,请使用词干提取。看一下专门用于阻止并提供几个选项的问题: SnowballMg4j等。作为JWI的一部分,还有WordNet 词干分析器。

如果你想要更复杂的结果,你必须处理词形还原,它也有几个库:Stanford CoreNLP(实际上并不那么复杂)或基于 WordNet 的CICWN

于 2015-04-16T10:49:40.107 回答