我不确定我的查询、我的文档结构或我对doc_count
andbg_count
字段的解释是否有问题。
当运行重要的术语聚合并按分数对结果进行排序时,可以理解的是,搜索术语始终位于该列表的首位。但是,我希望doc_count
andbg_count
将匹配搜索词,因为我理解 是doc_count
与键和过滤器词匹配的文档数,而背景计数是与过滤器词匹配的文档数. 因此,在申报人术语是关键的情况下,doc_count
并且bg_count
将是相等的。
相反,我通常看到doc_count
低于bg_count
并且分数(显着)小于 1。
举个例子:
{
"size" : 0,
"timeout" : 1800000,
"query" : {
"bool" : {
"filter" : {
"has_child" : {
"query" : {
"term" : {
"item_id" : 2606
}
},
"child_type" : "item"
}
}
}
},
"aggregations" : {
"st_agg" : {
"children" : {
"type" : "item"
},
"aggregations" : {
"items" : {
"significant_terms" : {
"field" : "item_id",
"size" : 500,
"exclude" : [ "51713398" ]
}
}
}
}
}
}
对于这些查询,我没有使用背景过滤器。这是在 ElasticSearch 2.3.2 上(不要判断,升级到 6.x 正在进行中)。
这是预期的吗?