0

我不确定我的查询、我的文档结构或我对doc_countandbg_count字段的解释是否有问题。

当运行重要的术语聚合并按分数对结果进行排序时,可以理解的是,搜索术语始终位于该列表的首位。但是,我希望doc_countandbg_count将匹配搜索词,因为我理解 是doc_count与键和过滤器词匹配的文档数,而背景计数是与过滤器词匹配的文档数. 因此,在申报人术语是关键的情况下,doc_count并且bg_count将是相等的。

相反,我通常看到doc_count低于bg_count并且分数(显着)小于 1。

举个例子:

{
"size" : 0,
"timeout" : 1800000,
"query" : {
  "bool" : {
    "filter" : {
      "has_child" : {
        "query" : {
          "term" : {
            "item_id" : 2606
          }
        },
        "child_type" : "item"
      }
    }
  }
},
"aggregations" : {
  "st_agg" : {
    "children" : {
      "type" : "item"
    },
    "aggregations" : {
      "items" : {
        "significant_terms" : {
          "field" : "item_id",
          "size" : 500,
          "exclude" : [ "51713398" ]
         }
       }
     }
   }
 }
}

对于这些查询,我没有使用背景过滤器。这是在 ElasticSearch 2.3.2 上(不要判断,升级到 6.x 正在进行中)。

这是预期的吗?

4

0 回答 0