0

我在java中使用PorterStemmer来获取动词的基本形式,但我发现动词“goes”和“gambles”有问题。它没有将其词干为“goe”和“gamble”,而是将它们词干为“goe”和“gambl”。有没有更好的工具可以处理以 -es 和 -ed 结尾的动词来检索动词的基本形式?带有 wordnet java 的 PS JAWS 也可以做到这一点。这是我的代码:

public class verb
{
    public static void main(String[] args)
    {
        PorterStemmer ps = new PorterStemmer();
        ps.setCurrent("gambles");
        ps.stem();
        System.out.println(ps.getCurrent());        
    }
}

这是控制台中的输出: gambl

4

1 回答 1

0

花几分钟阅读斯坦福 NLP 小组的这篇教程

https://nlp.stanford.edu/IR-book/html/htmledition/stemming-and-lemmatization-1.html

您会发现词干分析器实际上并没有像您想象的那样工作。它很粗糙,所以它并不总是给你一个完整的动词基本形式,结尾被砍掉。在您的情况下,由于您关心获得动词的完整基本形式,因此词形还原似乎对您更好。

于 2017-03-26T16:01:47.137 回答