我正在使用带有 Solr 的 nutch 来开发阿拉伯语文本的搜索引擎。我需要在我的阿拉伯语文本上实现一个词干分析器,在 Solr Stemmer 上进行搜索时,我发现它提供了这两个过滤器
<filter class="solr.ArabicNormalizationFilterFactory"/>
<filter class="solr.ArabicStemFilterFactory"/>
我试过了,但不明白他们做了什么..所以请任何人都可以帮我举一些例子吗?
并做到这两个做到这一点:
العملات 词根为 عملة
البسَاتِين ، بساتينكم 词根为 بستان
谢谢你。