0

我在 Java 中使用我的应用程序,并使用 Lucene 4.1.0 来使用 Porter Stemmer 方法。我已经阅读并实施了这个

这是我的代码

import org.apache.lucene.analysis.snowball.*;
import org.tartarus.snowball.ext.PorterStemmer;


 private String stemmer(String word){
        PorterStemmer obj = new PorterStemmer();
        obj.setCurrent(word);
        obj.stem();
        return obj.getCurrent();
}

此方法有效,但 Porter Stemmer 对某些单词无法正常工作,例如:

  1. 来源>>来源
  2. 耦合 >> 耦合
  3. 伴奏>>伴奏

也许算法中存在错误?如何解决这个问题呢?

4

2 回答 2

2

Porter Stemmer 算法有望转换 source >> sourcec。请从此处阅读有关搬运工词干分析算法的更多信息

于 2013-06-03T05:46:34.687 回答
0

您可以在搬运工词干分析器之上使用单词建议器。对于单词建议,您可以使用“suggester basic in java”

于 2014-02-25T15:45:47.330 回答