0

为什么 synonymTokenFilter 将扩展术语放在多词同义词中第一个标记的匹配之后?当我使用弹性搜索时,这当然也适用于任何 solr/lucene 大师。我只在索引时间应用它,但它与带状疱疹结合使用,所以顺序非常重要。

我有一个同义词:

爆米花机,爆米花机

我的 synonymTokenFilter 通过 elasticsearch 中的默认值扩展 = true。

当我查看我的令牌时,爆米花机总是插入爆米花和爆米花之间,无论输入项是爆米花爆米花还是爆米花机。

实例分析“爆米花popper

 t1:Popcorn t2:popcorn t3:machine t4:popper

实例解析“爆米花机

  t1:Popcorn t2:popcorn t3:machine t4:popper
4

1 回答 1

1

Lucene 令牌流实际上是一个图。同义词之类的东西确实会导致该图模型和令牌偏移量出现问题。然而,在较新的 Lucene 版本中情况正在改善。您可能只需要查看(Solr 和 Lucene)Jiras 即可找到相关讨论。

于 2013-10-02T01:50:03.140 回答