就像在 python nltk ( https://stackoverflow.com/a/10369407/3096792 ) 中有内置的 Stemmer 一样,我想知道 java apache opennlp 中是否有任何内置的 Porter Stemmer 虽然有一个接口在这个包 [opennlp.tools.stemmer.Stemmer] 下。由于我现在不知道或不需要知道词干背后的算法,我需要一个标准包下的 apache opennlp 工具包。如果不存在,java中的替代方法是什么?
问问题
4324 次
1 回答
2
您可以在此处使用 Apache Lucene Snowball 库
只需将此 jar 文件放在构建路径中并使用它
PorterStemmer stemmer = new PorterStemmer();
stemmer.setCurrent(input); //set string you need to stem
stemmer.stem(); //stem the word
stemmer.getCurrent();//get the stemmed word
于 2015-01-22T16:40:32.827 回答