我在 Java 中使用我的应用程序,并使用 Lucene 4.1.0 来使用 Porter Stemmer 方法。我已经阅读并实施了这个
这是我的代码
import org.apache.lucene.analysis.snowball.*;
import org.tartarus.snowball.ext.PorterStemmer;
private String stemmer(String word){
PorterStemmer obj = new PorterStemmer();
obj.setCurrent(word);
obj.stem();
return obj.getCurrent();
}
此方法有效,但 Porter Stemmer 对某些单词无法正常工作,例如:
- 来源>>来源
- 耦合 >> 耦合
- 伴奏>>伴奏
也许算法中存在错误?如何解决这个问题呢?