0

我是弹性搜索的新手,我正在尝试配置同义词,但它没有按预期工作。

我在我的领域有以下数据 1) 技术主管、模块主管、软件工程师、高级软件工程师

我希望如果我搜索 tl,那么它应该重新调整“技术主管”或“tl”但是它返回给我“技术主管”和“模块主管”,因为铅在索引 tme 处被标记化。

你能帮我用精确的设置解决这个问题吗?

我已经看到索引时间和搜索时间标记化,但无法理解。

同义词.txt:

tl,TL => 技术主管

se,SE => 软件工程师

sse => 高级软件工程师

映射文件:

{
  "settings": {
    "index": {
      "analysis": {
        "analyzer": {
          "synonym": {
            "tokenizer": "whitespace",
            "filter": [
              "synonym"
            ]
          }
        },
        "filter": {
          "synonym": {
            "type": "synonym",
            "synonyms_path": "synonyms.txt"
          }
        }
      }
    }
  },
  "mappings": {
    "tweet": {
      "properties": {
        "Domain": {
          "type": "string",
          "analyzer": "synonym"
        },
        "Designation": {
          "analyzer": "synonym",
          "type": "string"
        },
        "City": {
          "type": "string",
          "analyzer": "synonym"
        }
      }
    }
  }
}
4

1 回答 1

0

你的令牌在这里是相同的,所以你把那部分记下来了。您需要做的是确保您正在执行“AND”匹配而不是“或”,因为它似乎只是匹配任何单词而不是全部。

查看您的代币:

localhost:9200/test/_analyze?analyzer=synonym&text=technical lead
localhost:9200/test/_analyze?analyzer=synonym&text=tl

和查询

{
   "query": {
      "match": {
         "domain": {
            "query": "tl",
            "operator": "and"
         }
      }
   }
}

通常你希望你的搜索和索引分析器是一样的。但是,有许多高级示例并不可取。但是,在使用同义词的情况下,当您打开扩展时,您通常不想在其中一个或另一个中使用同义词。即tl,技术负责人

但是,由于您使用的是 => 类型的同义词,这实际上并不重要,因为所有单词都将转换为右侧的单词,而不是为逗号之间的每个单词创建一堆标记。

于 2013-10-10T15:15:47.510 回答