基本匹配查询:Billy Sue
测试匹配查询 #1:Billy Sue 和
测试匹配查询 #2:比利和苏
我们最终在 Base 和 #1 之间得到相同的分数,但 Base 和 #2 的分数相似但不同。
使用分析 API,两个测试查询中的停用词都被删除,但基本查询和测试查询 #2 之间的and
start_offset 和 end_offset 标记属性不同。Sue
本质上,剩余标记之间的停用词删除前距离被记录下来,并且对评分的影响很小但有限。
问题
有没有办法将令牌的start_offset
和end_offset
属性的计算延迟到停用词被删除之后,或者以其他方式防止删除的停用词以任何方式影响评分?