2

在 ElasticSearch 中呈现部分匹配之前,我需要对确切的字符串匹配进行排序

假设我有三个文件:

  • 迈克尔一个
  • 迈克尔·B
  • 米查

如果我搜索micha,它只会返回第三个文档。但是,如果我搜索micha*,我会按照上面列出的顺序获得所有三个文档。

我的问题是,如何让第三个文档(完全匹配)出现在其他结果之前?

  :analysis => {
      :filter => {
        "my_edge_ngram_filter" => {
          "type"     => "edgeNGram",
          "min_gram" => 1,
          "max_gram" => 128,
          "side" => "front",
        },
        "my_phone_filter" => {
          "type"    => "pattern_replace",
          "pattern" => "\\D",
          "replacement" => ""
        }
      },
      :analyzer => {
        "default_index" => {
          "tokenizer" => "uax_url_email",
          "filter" => [
            "standard",
            "lowercase",
            "stop",
            "my_edge_ngram_filter"
          ],
          "type"   => "custom"
        },
        "my_phone_analyzer" => {
          "tokenizer" => "keyword",
          "filter" => [
            "my_phone_filter",
          ],
          "type"   => "custom"
        },
        "default_search" => {
          "type"   => "standard"
        }
      }
    }
  }
4

1 回答 1

3

您可以使用 multi_field + 提升:

  • 一种是通过单词搜索进行映射,并以高于第二个字段的分数来提升它
  • 其次是使用您的 ngram 分析器进行映射。
"name" : {
      "type" : "multi_field",
      "fields" : {
          "name" : {
              "type" : "string",
              "index" : "analyzed",
              "index_analyzer" : "standard",
              "search_analyzer" : "standard",
              "boost" : 10.0
          },
          "partial": {
              "type" : "string",
              "index" : "analyzed",
              "index_analyzer" : "your_ngram_analyzer",
              "search_analyzer" : "standard",
              "boost" : 1.0
          }
  }
   }

然后在这两个字段上进行搜索,例如:

"query": {
    "query_string": {
      "query": "micha",
      "fields": [
        "name.partial",
        "name"
      ],
      "default_operator": "and"
    }
  }

PS:您还可以在查询中动态指定字段提升,例如:

"query": {
    "query_string": {
      "query": "micha",
      "fields": [
        "name.partial^1",
        "name^10"
      ],
      "default_operator": "and"
    }
  }
于 2013-09-21T16:08:59.713 回答