5

使用聚合框架的 mongo 有以下问题。假设和项目以秒为单位,t 和发生的事件 id,e,如:item:{t:11433, e:some_id}

我想要的是根据 t 和 e 进行聚合。这意味着在时间 t 内计算 id 'e' 的数量。使用 $group 的聚合很容易做到这一点。

但是,我想有一个不同的时间课程。例如,我想计算一个时间段中相同事件 id 的数量,例如。5秒。我可以在 js 或 python 中以编程方式执行此操作。我只是想知道它是否可以仅使用 mongo 使用级联组来工作。

我尝试使用 $divide[t,10] 进行投影。对于 11433,这将给出 1143.3 但似乎我无法删除 Mongo 中的 0.3(否则我可以按其他比例分组)。

有什么提示吗?

谢谢

4

1 回答 1

9

要获得 5 秒间隔的整数组键,您可以使用公式

t = t - (t % 5)  // % is the modula operator

在聚合框架中,这看起来像这样:

db.xx.aggregate([
     // you need two projections, as they can not be nested
     // this does not work:
     // { $project: { _id: 0, e: 1, t: 1, tk: { $subtract: [ "$t", $mod: [ "$t", 5 ] ] } } },
     //
     // get modula 5 of time in seconds:
     { $project: { _id: 0, e: 1, t: 1, tm5: { $mod: [ "$t", 5 ] } } }, 
     // subtract it from time:
     { $project: { _id: 0, e: 1, ti: { $subtract: [ "$t", "$tm5" ] } } }, 
     // now group on e and interval, 
     { $group: { _id: { e: "$e", interval: "$ti" }, count: { $sum: 1 } } },
])

对于此示例集合:

> db.xx.find()
{ "_id" : ObjectId("515e5a7157a0887a97cc8d1d"), "t" : 11433, "e" : "some_id" }
{ "_id" : ObjectId("515e60d457a0887a97cc8d1e"), "t" : 11434, "e" : "some_id" }
{ "_id" : ObjectId("515e60d857a0887a97cc8d1f"), "t" : 11438, "e" : "some_id" }

结果是:

{
    "result" : [
        {
            "_id" : {
                "e" : "some_id",
                "interval" : 11435
            },
            "count" : 1
        },
        {
            "_id" : {
                "e" : "some_id",
                "interval" : 11430
            },
            "count" : 2
        }
    ],
    "ok" : 1
}
于 2013-04-05T05:30:31.580 回答