elasticsearch - 弹性搜索聚合。按嵌套桶 doc_count 排序

Question

我想要实现的是通过唯一对（城市，州）进行聚合。根据 Elasticsearch 文档，术语聚合不支持从同一文档中的多个字段收集术语。因此，我创建了一个这样的嵌套 agg：

{
  "size": 0,
  "aggs": {
    "cities": {
      "terms": {
        "field": "address.city",
        "size": 12
      },
      "aggs": {
        "states": {
          "terms": {
            "field": "address.stateOrProvince"
          },
          "aggs": {
            "topCity": {
              "top_hits": {
                "size": 1,
                "sort": [
                  {
                    "price.value": {
                      "order": "desc" }}]}}}}}}}}

由于这种聚合，我得到如下响应：

{
  "aggregations": {
    "cities": {
      "buckets": [
        {
          "key": "las vegas",
          "doc_count": 5927,
          "states": {
            "buckets": [
              { "key": "nv", "doc_count": 5840 },
              { "key": "nm", "doc_count": 85 }
            ]
          }
        },
        {
          "key": "jacksonville",
          "doc_count": 5689,
          "states": {
            "buckets": [
              { "key": "fl", "doc_count": 2986 },
              { "key": "nc", "doc_count": 1962 },
              { "key": "ar", "doc_count": 290 }]}}]}}}

问题是如何获得按最深 doc_count 排序的结果？

预期的有序列表应该是这样的：

内华达州拉斯维加斯 (5840)
佛罗里达州杰克逊维尔 (2986)
杰克逊维尔, NC (1962)
杰克逊维尔 (290)
拉斯维加斯，纳米 (85)

score 2 · Accepted Answer

我不相信有一种方法可以跨多个存储桶对内部 doc_count 进行排序。在 ES 2.0（仍处于 Beta 版）中，您将能够对聚合采取行动，但这在 ES 1.x 中是不可能的

score 0 · Accepted Answer

我设法通过应用转换解决了这个问题

"transform": {
  "script": "ctx._source['address']['cityState'] = ctx._source['address']['city'] + ', ' + ctx._source['address']['state']"
}

然后聚合新添加的字段。按预期工作！

elasticsearch - 弹性搜索聚合。按嵌套桶 doc_count 排序

2 回答 2

Related

Reference