我有 2 个文档,正在搜索关键字“Twitter”。假设两个文档都是带有“标签”字段的博客文章。
文档 A 在“标签”字段中只有 1 个术语,它是“Twitter”。文档 B 在“标签”字段中有 100 个术语,但其中 3 个是“Twitter”。
即使文档 B 的频率更高,弹性搜索也会给文档 A 更高的分数。但是分数被“稀释”了,因为它有更多的术语。我如何给文档 B 一个更高的分数,因为它具有更高的搜索词频率?
我知道 ElasticSearch/Lucene 会根据文档中的术语数量进行一些规范化。如何禁用此规范化,以便文档 B 获得更高的分数?