0

我将 ElasticSearch 和 Lucene 与标准分析器一起使用。当查询为“Paleo”时,我想让我的索引不返回“Paleontology”的结果。但是,我确实希望它返回与“Paleo”相关的“Paleolithitic”的结果。换句话说,我希望分析器更智能,并过滤掉与关键字无关的词干,同时保留与其相关的词干。我有哪些可用的解决方案?

4

1 回答 1

0

实现您自己的词干过滤器(或扩展现有的过滤器)。标准分析器不使用词干提取,所以我不确定您使用的是哪个确切的词干分析器。不过,这里是 Lucene 中的 PorterStemmer。

http://lucene.apache.org/core/4_1_0/analyzers-common/org/apache/lucene/analysis/en/PorterStemFilter.html

如果这看起来太复杂,您可以在词干分析器之后放置一个 StopWord 过滤器,然后拒绝您想要的标记。

于 2014-06-23T18:48:28.497 回答