2

我有一个 mongo 文档的以下结构:

{
 "_id": ObjectId("4fba2558a0787e53320027eb"),
 "replies": {
    "0": {
      "email": ObjectId("4fb89a181b3129fe2d000000"),
      "sentDate": "2012-05-21T11: 22: 01.418Z" 
    } 
    "1": {
     "email": ObjectId("4fb89a181b3129fe2d000000"),
     "sentDate": "2012-05-21T11: 22: 01.418Z" 
    } 
    "2" ....
 }

}

如何计算集合中所有文档的所有回复?谢谢!

4

4 回答 4

5

在以下答案中,我正在使用一个简单的数据集,该数据集在整个集合中有五个回复:

> db.foo.find()
{ "_id" : ObjectId("4fba6b0c7c32e336fc6fd7d2"), "replies" : [ 1, 2, 3 ] }
{ "_id" : ObjectId("4fba6b157c32e336fc6fd7d3"), "replies" : [ 1, 2 ] }

因为我们不是简单地计算文档,所以db.collection.count()在这里帮不了我们。我们需要借助 MapReduce来扫描每个文档并聚合回复数组的长度。考虑以下:

db.foo.mapReduce(
    function() { emit('totalReplies', { count: this.replies.length }); },
    function(key, values) {
        var result = { count: 0 };
        values.forEach(function(value) {
            result.count += value.count;
        });
        return result;
    },
    { out: { inline: 1 }}
);

map 函数(第一个参数)在整个集合中运行,并在一个常量键下发出每个文档中的回复数。然后,Mongo 将考虑所有发出的值并多次运行 reduce 函数(第二个参数)以合并(字面意义上的 reduce)结果。希望这里的代码很简单。如果您不熟悉 map/reduce,需要注意的一点是 reduce 方法必须能够处理自己的输出。这在上面链接的 MapReduce 文档中有详细说明。

注意:如果你的集合非常大,你可能不得不使用另一种输出模式(例如集合输出);但是,inline它适用于小型数据集。

最后,如果您使用的是 MongoDB 2.1+,我们可以利用Aggregation Framework来避免编写 JS 函数并使这变得更加容易:

db.foo.aggregate(
    { $project: { replies: 1 }},
    { $unwind: "$replies" },
    { $group: {
        _id: "result",
        totalReplies: { $sum: 1 }
    }}
);

这里正在发生三件事。首先,我们告诉 Mongo 我们对该replies领域感兴趣。其次,我们想要展开数组,以便我们可以遍历投影中跨字段的所有元素。最后,我们将在“结果”桶下汇总结果(任何常量都可以),并添加1totalReplies每次迭代的结果中。执行此查询将产生以下结果:

{
    "result" : [{
        "_id" : "result",
        "totalReplies" : 5
    }],
    "ok" : 1
}

虽然我写了上面关于 Mongo 客户端的答案,但你应该可以毫不费力地将它们翻译成 PHP。您需要使用MongoDB::command()来运行 MapReduce 或聚合查询,因为 PHP 驱动程序目前没有任何帮助方法。PHP 文档中目前有一个 MapReduce 示例,您可以参考此 Google 组帖子以通过相同的方法执行聚合查询。

于 2012-05-21T17:12:01.433 回答
0

I've did it again using the group command of the PHP Mongo Driver. It's similar to a MapReduce command.

$keys = array("replies.type" => 1); //keys for group by
$initial = array("count" => 0); //initial value of the counter
$reduce = "function (obj, prev) { prev.count += obj.replies.length; }";
$condition = array('replies' => array('$exists' => true), 'replies.type' => 'follow');
$g = $db->foo->group($keys, $initial, $reduce, $condition);
echo $g['count'];

Thanks jmikola for giving links to Mongo.

于 2012-05-27T09:23:37.653 回答
0

我还没有检查你的代码,可能也可以。我做了以下,它只是工作:

$replies = $db->command(
   array(
       "distinct" => "foo",
       "key" => "replies"
        ) 
   );
$all = count($replies['values']); 
于 2012-05-21T23:44:28.377 回答
0

JSON应该是

{
  "_id": ObjectId("4fba2558a0787e53320027eb"),
  "replies":[
             {
             0: {
                     "email": ObjectId("4fb89a181b3129fe2d000000"),
                     "sentDate": "2012-05-21T11: 22: 01.418Z" 
                 }, 
             1: {
                     "email": ObjectId("4fb89a181b3129fe2d000000"),
                     "sentDate": "2012-05-21T11: 22: 01.418Z" 
                }, 
             2: {....}
           ]

}
于 2013-08-28T22:49:16.900 回答