在以下答案中,我正在使用一个简单的数据集,该数据集在整个集合中有五个回复:
> db.foo.find()
{ "_id" : ObjectId("4fba6b0c7c32e336fc6fd7d2"), "replies" : [ 1, 2, 3 ] }
{ "_id" : ObjectId("4fba6b157c32e336fc6fd7d3"), "replies" : [ 1, 2 ] }
因为我们不是简单地计算文档,所以db.collection.count()在这里帮不了我们。我们需要借助 MapReduce来扫描每个文档并聚合回复数组的长度。考虑以下:
db.foo.mapReduce(
function() { emit('totalReplies', { count: this.replies.length }); },
function(key, values) {
var result = { count: 0 };
values.forEach(function(value) {
result.count += value.count;
});
return result;
},
{ out: { inline: 1 }}
);
map 函数(第一个参数)在整个集合中运行,并在一个常量键下发出每个文档中的回复数。然后,Mongo 将考虑所有发出的值并多次运行 reduce 函数(第二个参数)以合并(字面意义上的 reduce)结果。希望这里的代码很简单。如果您不熟悉 map/reduce,需要注意的一点是 reduce 方法必须能够处理自己的输出。这在上面链接的 MapReduce 文档中有详细说明。
注意:如果你的集合非常大,你可能不得不使用另一种输出模式(例如集合输出);但是,inline
它适用于小型数据集。
最后,如果您使用的是 MongoDB 2.1+,我们可以利用Aggregation Framework来避免编写 JS 函数并使这变得更加容易:
db.foo.aggregate(
{ $project: { replies: 1 }},
{ $unwind: "$replies" },
{ $group: {
_id: "result",
totalReplies: { $sum: 1 }
}}
);
这里正在发生三件事。首先,我们告诉 Mongo 我们对该replies
领域感兴趣。其次,我们想要展开数组,以便我们可以遍历投影中跨字段的所有元素。最后,我们将在“结果”桶下汇总结果(任何常量都可以),并添加1
到totalReplies
每次迭代的结果中。执行此查询将产生以下结果:
{
"result" : [{
"_id" : "result",
"totalReplies" : 5
}],
"ok" : 1
}
虽然我写了上面关于 Mongo 客户端的答案,但你应该可以毫不费力地将它们翻译成 PHP。您需要使用MongoDB::command()来运行 MapReduce 或聚合查询,因为 PHP 驱动程序目前没有任何帮助方法。PHP 文档中目前有一个 MapReduce 示例,您可以参考此 Google 组帖子以通过相同的方法执行聚合查询。