为什么 synonymTokenFilter 将扩展术语放在多词同义词中第一个标记的匹配之后?当我使用弹性搜索时,这当然也适用于任何 solr/lucene 大师。我只在索引时间应用它,但它与带状疱疹结合使用,所以顺序非常重要。
我有一个同义词:
爆米花机,爆米花机
我的 synonymTokenFilter 通过 elasticsearch 中的默认值扩展 = true。
当我查看我的令牌时,爆米花机总是插入爆米花和爆米花之间,无论输入项是爆米花爆米花还是爆米花机。
实例分析“爆米花popper ”
t1:Popcorn t2:popcorn t3:machine t4:popper
实例解析“爆米花机”
t1:Popcorn t2:popcorn t3:machine t4:popper