我正在尝试评估将 Solr 中的词干过滤器从 Porter 切换到 KStem。我看到了有关通过 direct_conflations.txt 文件和其他文件配置 KStem 的能力的参考,但我似乎找不到有关如何格式化此文件或如何告诉 KStem 加载此配置文件的文档。
这是加载 KStem 的 schema.xml 中的示例 solr 配置
<analyzer type="query">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.StandardFilterFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="false"/>
<filter class="solr.KStemFilterFactory"/>
</analyzer>
使用 Porter,您可以像这样配置受保护的字:
<filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt"/>
我想知道是否有类似的方式来配置 KStem,有人知道或有人知道这在哪里记录吗?