1

我有以下聚合:

db.reports.aggregate({ $group: { _id: "$user", reports: { $push: {report: {properties: "$properties"} } }}}, { $project: { _id: 0, user: "$_id", reports: "$reports"} })

我想以某种方式限制推送到数组中的报告数量。IE 我想将报告限制为用户定义的值。1,5,10 等。意思是我希望在报告字段中包含 N 个报告(我将按时间戳排序)。现在我正在推送所有报告,不确定如何限制每个用户的报告数量。

我尝试了 $limit,但这并没有奏效,因为它限制了返回的用户数量,而不是推送到报告数组中的报告数量。

基本上我想按用户对我的报告进行分组,并且只包含一定数量的报告。我想尽早限制报告的数量,这样我就不必在整个管道中处理整个集合

4

1 回答 1

2

您是否考虑过使用group()?假设您的数据如下所示:

{ "_id" : ObjectId("732"), "user" : "john", "reports" : [  "report1",  "report2",  "report3" ] }
{ "_id" : ObjectId("733"), "user" : "john", "reports" : [  "report4",  "report5",  "report6" ] }
{ "_id" : ObjectId("734"), "user" : "max", "reports" : [  "report1",  "report2",  "report3" ] }
{ "_id" : ObjectId("735"), "user" : "max", "reports" : [  "report4" ] }
{ "_id" : ObjectId("736"), "user" : "eliza", "reports" : [  "report1",  "report2" ] }

假设报告是初始模式中的一个数组,您的聚合调用变为:

var reduce_f = function(curr, result) { 
  result.reports = result.reports.concat(curr.reports); 
}; 

var finalize_f = function(result) { 
  var limit = 5; 
  result.reports = result.reports.slice(0, limit); 
};

db.reports.group({ 
  key: { user: 1 },
  reduce: reduce_f,
  initial: { reports : [] },
  finalize: finalize_f
})

请注意,组不会在分片环境中工作。

于 2013-09-19T20:21:19.523 回答