elasticsearch - 基于大多数匹配的查询的弹性搜索相关性

Question

我有以下映射

posts":{
"properties":{
  "prop1": {
    "type": "nested",
    "properties": {
         "item1": {
            "type": "string",
            "index": "not_analyzed"
         },
         "item2": {
            "type": "string",
            "index": "not_analyzed"
         },
         "item3": {
            "type": "string",
            "index": "not_analyzed"
         }
      }
  },
  "name": {
    "type": "string",
    "index": "not_analyzed"
  }
 }
}

考虑这些映射的索引对象如下

{
"name": "Name1",
"prop1": [
    {
        "item1": "val1",
        "item2": "val2",
        "item3": "val3"           
    },
    {
        "item1": "val1",
        "item2": "val5",
        "item3": "val6"          
    }
  ]
}

还有另一个对象

{
"name": "Name2",
"prop1": [
    {
        "item1": "val2",
        "item2": "val7",
        "item3": "val8"           
    },
    {
        "item1": "val12",
        "item2": "val9",
        "item3": "val10"          
    }
  ]
}

现在说我想搜索 prop1.item1 值为“val1”或“val2”的文档。我还希望以这样一种方式对结果进行排序，即同时具有 val1 和 val2 的文档将比仅具有“val1”或“val2”之一的文档得分更高。

我尝试了以下查询，但似乎没有根据匹配数得分

{
"query": {
   "filtered": {
    "query": {"match_all": {}},
    "filter": {
      "nested": {
        "path": "prop1",
          "filter": {
            "or": [
              {
                "and": [
                  {"term": {"prop1.item1": "val1"}},
                  {"term": {"prop1.item2": "val2"}}
                ]
              },
              {
                "and": [
                  {"term": {"prop1.item1": "val1"}},
                  {"term": {"prop1.item2": "val5"}}
                ]
              },
              {
                "and": [
                  {"term": {"prop1.item1": "val12"}},
                  {"term": {"prop1.item2": "val9"}}
                ]
              }
            ]
         }
        }
      }
    }
  }
}

现在虽然它应该给出两个文档，但第一个文档应该有更高的分数，因为它包含过滤器中的 2 个东西，而第二个文档只包含一个。有人可以帮助进行正确的查询以根据大多数匹配项对结果进行排序吗？

score 2 · Accepted Answer

您的查询遇到的最大问题是您使用了过滤器。因此不计算分数。比你使用 match_all 查询，它给所有文档的分数为 1。用查询替换过滤的查询并使用 bool 查询而不是 bool 过滤器。

希望有帮助。

score 1 · Accepted Answer

过滤器不计算分数，而是使用嵌套查询：

{
    "query": {
        "nested": {
            "score_mode": "sum",
            "path": "prop1",
            "query": {
                "bool": {
                    "should": [{
                        "bool": {
                            "must": [{
                                "match": {
                                    "prop1.item1": "val1"
                                }
                            },
                            {
                               "match": {
                                   "prop1.item2": "val2"
                               }
                           }]
                       }
                   },
                   {
                       "bool": {
                           "must": [{
                               "match": {
                                   "prop1.item1": "val1"
                               }
                           },
                           {
                               "match": {
                                   "prop1.item2": "val5"
                               }
                          }]
                      }
                  },
                  {
                      "bool": {
                          "must": [{
                              "match": {
                                  "prop1.item1": "val12"
                               }
                           },
                           {
                               "match": {
                                   "prop1.item2": "val9"
                               }
                           }]
                       }
                   }]
               }
           }
       }
   }
}

elasticsearch - 基于大多数匹配的查询的弹性搜索相关性

2 回答 2

Related

Reference