0

在 SOLR 3.5 文本字段类型中,StopFilterFactory 列在 PorterStemFilterFactory 之前。

这是否意味着如果我想停止例如“游戏”和“游戏”,我必须将两者都添加到停用词中?

如果是这样,是否会在 PorterStemFilterFactory 之后移动 StopFilterFactory,并且只在停用词中添加“游戏”会导致“游戏”和“游戏”的出现都被剥离?

我想真正的问题是最好的方法是什么,我是否需要将单词的所有变体添加到停用词中?

4

1 回答 1

2

PorterStemFilterFactory提供积极的词干提取,并且在停用词过滤器之前设置可能不会导致适当的停用词删除,因为根可能与您尝试停止的不同。您可以在停用词过滤器之前
添加只能使用的复数处理。 这将处理复数,然后停用词将只需要处理单数版本。 然后,您可以添加 PorterStemFilterFactory 过滤器来处理正确的词干提取。solr.EnglishMinimalStemFilterFactory

于 2013-06-12T10:19:34.970 回答