2

有一个 ruby​​ 词干分析器https://github.com/aurelian/ruby-stemmer,但它 1) 不会词干英语不规则动词 2) 无法在 Windows 上构建原生扩展。是否有替代方案可以解决至少一个问题?

4

3 回答 3

6

我认为您应该搜索词形还原器(它具有有关形态学的信息并且可以处理不规则单词)而不是词干分析器(通常只是切断单词的结尾)。请参阅Manning、Raghavan 和 Schütze 关于信息检索的在线书籍中的解释。

我还没有尝试过,但是快速搜索发现了这个用于 Ruby 的英文词形还原器:elemma

可以进行词形还原的常用(非 Ruby)英语形态分析器是morpha

于 2010-12-22T11:50:59.540 回答
4

没有一个词干分析器能够处理英语中的不规则动词。

于 2010-12-21T16:45:02.303 回答
1

我在搜索基于 ruby​​ 的 NLP 时发现了这一点http://mendicantbug.com/2009/09/13/nlp-resources-for-ruby/

于 2011-04-05T12:46:36.343 回答