0

我正在使用 Elasticsearch 7.6 并使用以下映射定义索引关键字列表:

"keywords" : {
  "type" : "text",
  "analyzer": "std_folded",
  "store": true,
  "fields": {
    "keyword": {
      "type": "keyword"
    }
  }
},

如您所见,该字段的名称keywords将给出一个单词列表。另外,我定义keywords.keywordkeyword类型。

是否可以为每个单词分配一些值(分数)?我希望稍后在我的脚本查询中检索该值。

4

1 回答 1

1

背景

因此,如果不是每个单词而是为每个字段分配一个特定值(如您的情况下的分数),您可以使用类似于index-time boost 的东西,它从 5.0.0 开始被弃用。

如果我理解,您的keywords字段可以有多个值,例如foo,bar并且baz属于同一个文档。并且您想给出所有不同的分数,例如foo:1,bar:2baz:3这是分数或提升场上价值,而不是场上。

解决方案:使用嵌套数据类型可以解决这个问题。

工作示例:

索引定义

{
  "mappings": {
    "properties": {
      "keywords": {
        "type": "nested" --> note this
      }
    }
  }
}

索引示例文档

{
  "keywords" : [
    {
      "keyword" : "foo",
      "score" :  1
    },
    {
      "keyword" : "bar",
      "score" :  2
    },
    {
        "keyword" : "baz",
        "score" : 3
    }
  ]
}

搜索查询以获取具有foo和得分的文档1

{
    "query": {
        "nested": {
            "path": "keywords",
            "query": {
                "bool": {
                    "must": [
                        {
                            "match": {
                                "keywords.keyword": "foo"
                            }
                        },
                        {
                            "match": {
                                "keywords.score": 1
                            }
                        }
                    ]
                }
            },
            "inner_hits": { --> notice this, it would bring inner doc `foo:1`

            }
        }
    }
}

搜索结果

 "hits": [
      {
        "_index": "nested",
        "_type": "_doc",
        "_id": "1",
        "_score": 1.9808291,
        "_source": {
          "keywords": [
            {
              "keyword": "foo",
              "score": 1
            },
            {
              "keyword": "bar",
              "score": 2
            },
            {
              "keyword": "baz",
              "score": 3
            }
          ]
        },
        "inner_hits": {
          "keywords": {
            "hits": {
              "total": {
                "value": 1,
                "relation": "eq"
              },
              "max_score": 1.9808291,
              "hits": [
                {
                  "_index": "nested",
                  "_type": "_doc",
                  "_id": "1",
                  "_nested": {
                    "field": "keywords",
                    "offset": 0
                  },
                  "_score": 1.9808291, --> your expected result in inner hits
                  "_source": {
                    "keyword": "foo",
                    "score": 1
                  }
                }
              ]
于 2020-04-06T03:25:43.087 回答