我索引了以下对象:
{ "ProjectName" : "Project 1",
"Roles" : [
{ "RoleName" : "Role 1", "AddedAt" : "2015-08-14T17:11:31" },
{ "RoleName" : "Role 2", "AddedAt" : "2015-09-14T17:11:31" } ] }
{ "ProjectName" : "Project 2",
"Roles" : [
{ "RoleName" : "Role 1", "AddedAt" : "2015-10-14T17:11:31" } ] }
{ "ProjectName" : "Project 3",
"Roles" : [
{ "RoleName" : "Role 2", "AddedAt" : "2015-11-14T17:11:31" } ] }
即,添加了不同角色的项目列表,在不同时间添加。 (角色列表是一个嵌套字段)
我需要的是进行聚合,它可以选择每个特定角色存在多少个项目,但只有(!)如果角色在特定时期被添加到项目中。
一个经典的查询(没有日期rande过滤)看起来像这样(并且效果很好):
{ // ... my main query here
"aggs" : {
"agg1" : {
"nested" : {
"path" : "Roles"
},
"aggs" : {
"agg2": {
"terms": {
"field" : "Roles.RoleName"
},
"aggs": {
"agg3":{
"reverse_nested": {}
}}}}}}
但是这种方法对我不起作用,因为如果我需要按从“2015-09 -01”开始的日期进行过滤,则将为第一个项目(即项目为他们)因为“角色 1”会因为“角色 2”的项目因为“角色 2”AddedAt 日期标准而命中。
所以,我认为,我应该在某处另外添加以下条件:
"range": { "Roles.AddedAt": {
"gte": "2015-09-01T00:00:00",
"lte": "2015-12-02T23:59:59"
}}
但我找不到正确的方法来做到这一点。
工作查询的结果(有点)如下:
"aggregations": {
"agg1": {
"doc_count": 17,
"agg2": {
"buckets": [
{
"key": "Role 1",
"doc_count": 2,
"agg3": {
"doc_count": 2
}
},
{
"key": "Role 2",
"doc_count": 2,
"agg3": {
"doc_count": 2
}
},