我是弹性搜索的新手。我无法理解文档中字段的提升值的校准和缩放。就像我们应该如何决定字段的提升值一样,它才能按预期工作。我也浏览了一些在线博客和 es 文档,上面写着 es 对提升值进行规范化和内部优化?这是如何运作的?
例如:如果我们的文档中有标签、标题、名称和文本字段,我们应该如何确定这些的提升值?
我是弹性搜索的新手。我无法理解文档中字段的提升值的校准和缩放。就像我们应该如何决定字段的提升值一样,它才能按预期工作。我也浏览了一些在线博客和 es 文档,上面写着 es 对提升值进行规范化和内部优化?这是如何运作的?
例如:如果我们的文档中有标签、标题、名称和文本字段,我们应该如何确定这些的提升值?
Elasticsearch 使用布尔模型来匹配文档,然后使用评分模型来确定相关性(即排名)。评分模型利用 TF/IDF 评分,以及一些附加功能。这些 TF/IDF 分数是针对查询中的每个匹配字段计算的,然后汇总以生成文档的总体分数。为了深入研究这个过程,我建议对您的查询运行解释,以查看每个字段的分数如何影响文档的整体相关性。
作为数据专家,您最有能力确定哪些字段对文档的相关性影响最大。为某个字段找到正确的提升值是关于调整杠杆,直到找到最适合您期望结果的公式(此外,如果您有用户,A/B 测试可以在这里提供帮助)。