0

我在 SOLR 中使用 KStem 过滤器工厂(KStemFF)。我意识到 KStemFF 并不是 100% 准确的。

例如,它不会将单词“cards”改为“card”。

“声卡”和“声卡”返回不同的结果。

有没有办法只使用 KStemFF 来完成这项工作?我意识到在这种情况下使用其他词干分析器(如 porter-stemmer)可能会有所帮助,但我真的不想在项目中使用多个词干分析器。

4

1 回答 1

0

KStem 在词干提取方面不如 PorterStem 激进,因此可能会根据其规则跳过转换某些复数形式。在做出选择之前,您可能希望根据性能和结果比较几个词干分析器。没有一个词干分析器可以为您提供 100% 的准确度和所需的结果,它必须是根据您的结果最适合的。

于 2016-09-02T07:33:32.367 回答