1

我正在使用下面的代码,当我输入“cu”时它不会自动提示为凝乳

但它确实将文件与酸奶相匹配,这是正确的。如何获得同义词的自动完成和同义词的文档匹配?

PUT products
{
  "settings": {
    "index": {
      "analysis": {
        "analyzer": {
          "synonym_analyzer": {
            "tokenizer": "standard",
            "filter": [
            "lowercase",
              "synonym_graph"
            ]
          }
        },
        "filter": {
          "synonym_graph": {
            "type": "synonym_graph",
            "synonyms": [
               "yogurt, curd, dahi"
            ]
          }
        }
      }
    }
  }
}
PUT products/_mapping
{
  "properties": {
    "description": {
      "type": "text",
      "analyzer": "synonym_analyzer"
    }
  }
}
POST products/_doc
{
  "description": "yogurt"
}
GET products/_search
{
  "query": {
    "match": {
      "description": "cu"
    }
  }
}
4

1 回答 1

0

当您在synonym_graph过滤器中提供同义词列表时,仅意味着 ES 将互换处理任何同义词。但是当它们通过standard分析器进行分析时,只会产生全词标记

POST products/_analyze?filter_path=tokens.token
{
  "text": "yogurt",
  "field": "description"
}

产生:

{
  "tokens" : [
    {
      "token" : "curd"
    },
    {
      "token" : "dahi"
    },
    {
      "token" : "yogurt"
    }
  ]
}

因此,正match_query则不会在此处删除它,因为标准分析器没有为它提供足够的可匹配子字符串(n-grams)的上下文。

同时,您可以替换matchmatch_phrase_prefixwhich 完全符合您的要求 - 匹配有序的字符序列,同时考虑同义词:

GET products/_search
{
  "query": {
    "match_phrase_prefix": {
      "description": "cu"
    }
  }
}

但是,正如查询名称所暗示的那样,这只适用于前缀。如果您喜欢自动补全,无论子字符串匹配发生在哪里,都可以建议术语,请查看我在谈论利用 n-grams的其他答案。

于 2021-03-06T09:43:28.310 回答