0

我正在尝试评估将 Solr 中的词干过滤器从 Porter 切换到 KStem。我看到了有关通过 direct_conflations.txt 文件和其他文件配置 KStem 的能力的参考,但我似乎找不到有关如何格式化此文件或如何告诉 KStem 加载此配置文件的文档。

这是加载 KStem 的 schema.xml 中的示例 solr 配置

<analyzer type="query">
  <tokenizer class="solr.StandardTokenizerFactory"/>
    <filter class="solr.StandardFilterFactory"/>
    <filter class="solr.LowerCaseFilterFactory"/>
    <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="false"/>
    <filter class="solr.KStemFilterFactory"/>
</analyzer>

使用 Porter,您可以像这样配置受保护的字:

<filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt"/>

我想知道是否有类似的方式来配置 KStem,有人知道或有人知道这在哪里记录吗?

4

1 回答 1

1

你最好的朋友正在查看 solr 源代码。我快速浏览了一下,发现与 EnglishPorterFilterFactory 不同,KStemFilterFactory 不查找受保护的令牌列表。HTH。

于 2012-06-21T20:16:50.473 回答