0

假设我有 3 个文档

doc_1 = {
    "citedIn": [
        "Bar Councils Act, 1926 - Section 15",
        "Contract Act, 1872 - Section 23"
    ]
}

doc_2 = {
    "citedIn":[
        "15 C. B 400", 
        "Contract Act, 1872 - Section 55"
    ]
}

doc_3 = {
    "citedIn":[
        "15 C. B 400", 
        "Contract Act, 1872 - Section 15"
    ]
}

这里citedIn的字段是一个数组对象。现在我想运行一个标准match查询

{
    "query":
    {
        "match": {"citedIn":{"query": "Contract act 15" , "operator":"and" }}
    }

}

上面的查询返回所有 3 个文档,但它假设doc_3只返回doc_3 包含Contractact并且15一起在单个数组元素中。

我将如何实现这一目标?

任何建议/解决方案都会更好

嵌套数据类型更新:

我确实尝试过嵌套字段。这是我的映射

{
    "mappings": {
        "properties": {
            "citedIn": {
                "type": "nested",
                "include_in_parent": true,
                "properties": {
                    "someFiled": {
                        "type": "text",
                        "fields": {
                            "keyword": {
                                "type": "keyword",
                                "ignore_above": 256
                            }
                        }
                    }
                }
            }
        }
    }
}

这是我的数据

doc_1 = {
    "citedIn": [
        {"someFiled" : "Bar Councils Act, 1926 - Section 15"},
        {"someFiled" : "Contract Act, 1872 - Section 23"}
    ]
}

doc_2 = {
    "citedIn":[
        {"someFiled" : "15 C. B 400"}
        {"someFiled" : "Contract Act, 1872 - Section 55"}
    ]
}

doc_3 = {
    "citedIn":[
        {"someFiled" : "15 C. B 400"},
        {"someFiled" : "Contract Act, 1872 - Section 15"}
    ]
}

这是我的查询

{
    "query":
    {

        "match": {"citedIn.someFiled":{"query": "Contract act 15" , "operator":"and" }}
            
        
    }
}

但仍然得到相同的结果

4

2 回答 2

1

您无法实现这一点,因为您要索引的是citedIn字段中字符串的数组,并且所有 Elasticsearch 字段默认情况下都是多值的,因为它是在 Lucene 中设计的,并且 elasticsearch 构建在Lucene 搜索库

请阅读elasticsearch 中的数组以获取更多信息,尤其是最后一个重要说明,如下图所示:

在此处输入图像描述

如上图所示,数组中的所有字符串实际上都属于同一字段,因此 ES 无法识别您的搜索字符串是否属于数组中的同一字符串,因此您获得了所有文档正在搜索。

除非您将这些字符串作为其他字段(如nested字段)的一部分进行索引,但为此您需要提供字段的名称,它就像一个映射,其中键是您的字段名称,值是字段值,而不是查询字段名称,您不会'无法实现您的用例。

于 2020-10-02T11:42:19.363 回答
1

添加具有索引数据、映射、搜索查询和搜索结果的工作示例。

您需要使用嵌套查询来搜索嵌套字段

索引映射

{
    "mappings": {
        "properties": {
            "citedIn": {
                "type": "nested"
            }
        }
    }
}

指数数据:

 {
        "citedIn": [
            {
                "someFiled": "Bar Councils Act, 1926 - Section 15"
            },
            {
                "someFiled": "Contract Act, 1872 - Section 23"
            }
        ]
    }
    {
        "citedIn": [
            {
                "someFiled": "15 C. B 400"
            },
            {
                "someFiled": "Contract Act, 1872 - Section 55"
            }
        ]
    }
    {
        "citedIn": [
            {
                "someFiled": "15 C. B 400"
            },
            {
                "someFiled": "Contract Act, 1872 - Section 15"
            }
        ]
    }

搜索查询:

{
    "query": {
        "nested": {
            "path": "citedIn",
            "query": {
                "bool": {
                    "must": [
                        {
                            "match": {
                                "citedIn.someFiled": "contract"
                            }
                        },
                        {
                            "match": {
                                "citedIn.someFiled": "act"
                            }
                        },
                        {
                            "match": {
                                "citedIn.someFiled": 15
                            }
                        }
                    ]
                }
            },
            "inner_hits": {}
        }
    }
}

搜索结果:

"inner_hits": {
          "citedIn": {
            "hits": {
              "total": {
                "value": 1,
                "relation": "eq"
              },
              "max_score": 1.620718,
              "hits": [
                {
                  "_index": "stof_64170705",
                  "_type": "_doc",
                  "_id": "3",
                  "_nested": {
                    "field": "citedIn",
                    "offset": 1
                  },
                  "_score": 1.620718,
                  "_source": {
                    "someFiled": "Contract Act, 1872 - Section 15"
                  }
                }
              ]
            }
          }
        }
      }
于 2020-10-03T01:52:54.183 回答