0

我有一个具有以下默认配置的弹性搜索节点

index :
  analysis :
    analyzer :
      default_index :
        type : custom
        tokenizer : whitespace
        filter :
        - lowercase
        - asciifolding
        - stop
        - my_ngram
        char_filter : html_strip
      default_search:
        type : custom
        tokenizer :  whitespace
        filter:
        - lowercase
        - asciifolding
        - stop
        char_filter :  html_strip
    filter:
      my_ngram:
        type: nGram
        max_gram: 50

然后我创建一个索引“测试”

curl -XPUT localhost:9200/test -d '{
  "settings": {
    "index": {
      "number_of_shards": 1,
      "number_of_replicas": 0
    }
  }
}'

我已经发布

curl -XPOST localhost:9200/test/sub -d '{"n1" : "so?:me"}'

搜索为

curl -XPOST 'localhost:9200/test/sub/_search?pretty&q=\?'

我得到了上面显示的正确结果,但是当我这样做时

curl -XPOST localhost:9200/test/sub/_search -d '{
  "query": {
    "query_string": {
      "query": "\?"
    }
  }
}'

我得到一个例外如下

{
  "error": "SearchPhaseExecutionException[Failed to execute phase [query_fetch], total failure;
            shardFailures {[1fLLfu79Qou8RbdrI6y8qw][test][0]: 
            SearchParseException[[test][0]: from[-1],size[-1]: 
            Parse Failure [Failed to parse source [
              {
                "query": {
                  "query_string": {
                    "query": "\\?"
                  }
                }
              }
            ]]];
            nested: QueryParsingException[[test] Failed to parse]; 
            nested: JsonParseException[Unrecognized character escape '?' (code 63)\n at [Source: [B@1601cda; line: 1, column: 45]]; }]",
  "status": 500
}

我不确定我在这里缺少什么?

更多细节,我发现它更令人困惑。

如果我发布

curl -XPOST localhost:9200/test/sub/_search -d '{
  "query": {
    "query_string": {
      "query": "\\?"
    }
  }
}'

我正确地得到了结果,看起来 JSON 转义字符必须自己转义。但后来我发布

curl -XPOST localhost:9200/test/sub -d '{"n1" : "oi\\me"}'

现在如果我发布

curl -XPOST localhost:9200/test/sub/_search?pretty -d '{
  "query": {
    "query_string": {
      "query": "\\\\"
    }
  }
}'

我得到了结果,假设我之前发现的内容仅代表答案中的第一个“\”,它非常理想地显示

curl -XPOST localhost:9200/test/sub/_search?pretty -d '{
  "query": {
    "query_string": {
      "query": "\\\\\\\\"
    }
  }
}'

应该工作,但它没有。所以很困惑。

4

2 回答 2

0

我认为这是因为在 中oi\\me,第一个反斜杠用于转义第二个反斜杠,而不是存储为文字字符。这解释了为什么\\\\有效,因为在 HTTP 请求中,两个斜杠转义了另外两个,然后在查询中,剩余的第一个转义了第二个。

作为一般规则,当您将查询作为 JSON 传递时,您必须转义更多。那是,

curl -XPOST 'localhost:9200/test/sub/_search?pretty&q=\?'

是相同的

curl -XPOST 'localhost:9200/test/sub/_search?pretty' -d '{"query" : {"query_string" : {"query" : "\\?"}}}'

于 2013-08-01T19:41:55.677 回答
0

是的,您对转义的表示是正确的,我昨天工作得很晚,但仍然无法正确搜索“\”,对于 json 搜索帖子,我们需要一个额外的“\”,因此对于第一个选择,我将发布

curl -XPOST 'localhost:9200/test/sub/_search?pretty' -d '{"query" : {"query_string" : {"query" : "\\"}}}'

但这无助于必须使用“\\”并且不能使用更多或更少,因此试图找出匹配单个“\”和“\”的查询是什么,尽管如果我只是转义每个特殊字符,则在 python 中使用弹性工具使用“\”,它可以通过代码很好地处理包括“\”在内的所有特殊字符,但 curl 没有

于 2013-08-02T10:44:52.803 回答