2

我想创建一个关于每分钟存储多少新文档的统计数据。

由于具有标准 ObjectID 的 _id 字段已经包含文档创建的时间戳,我认为应该可以以某种方式使用它。

在 Stackoverflow 上,我发现以下 map reduce 代码可以在有用于创建数据的专用字段时完成它

Map-Reduce count 每分钟 MongoDB 的文档数

map = function() {

var created_at_minute = new Date(this.created_at.getFullYear(),
                                 this.created_at.getMonth(), 
                                 this.created_at.getDate(), 
                                 this.created_at.getHours(), 
                                 this.created_at.getMinutes());
    emit(created_at_minute, {count: 1});
}

reduce = function(key, values) { 
         var total = 0;
         for(var i = 0; i < values.length; i++) { total += values[i].count; }
         return {count: total};
}

根据 Mongo DB 文档(http://docs.mongodb.org/manual/reference/object-id/),应该可以通过调用 ObjectId("507f191e810c19729de860ea").getTimestamp() 从 _id 获取时间戳。

现在我不知道是否可以在 map 函数中使用这个 getTimestamp() 。

有没有人知道怎么做或者有更好的方法吗?

我需要它可以在 python 或 php 中实现

4

1 回答 1

4

你确实可以用 M/R 做到这一点。getTimestamp()在 M/R 中工作,因为它在服务器上的 JavaScript 中运行,无论您的客户端语言是 PHP 还是 Python:

map = function() {
    var datetime = this._id.getTimestamp();

    var created_at_minute = new Date(datetime.getFullYear(),
                                     datetime.getMonth(),
                                     datetime.getDate(),
                                     datetime.getHours(),
                                     datetime.getMinutes());
    emit(created_at_minute, {count: 1});
}

reduce = function(key, values) {
    var total = 0;
    for(var i = 0; i < values.length; i++) { total += values[i].count; }
    return {count: total};
}

db.so.mapReduce( map, reduce, { out: 'inline' } );
db.inline.find();

输出如下:

{ "_id" : ISODate("2013-08-05T15:24:00Z"), "value" : { "count" : 9 } }
{ "_id" : ISODate("2013-08-05T15:26:00Z"), "value" : { "count" : 2 } }

但是,我建议您不要使用 M/R,而是转而使用聚合框架,因为它更快,因为可以使用索引并同时运行。目前,A/F 还没有一个运算符来从ObjectID字段中获取时间戳,因此您必须在插入时存储时间。Fe 有这样的文件:

db.so.drop();
db.so.insert( { date: new ISODate( "2013-08-05T15:24:15" ) } );
db.so.insert( { date: new ISODate( "2013-08-05T15:24:19" ) } );
db.so.insert( { date: new ISODate( "2013-08-05T15:24:25" ) } );
db.so.insert( { date: new ISODate( "2013-08-05T15:24:32" ) } );
db.so.insert( { date: new ISODate( "2013-08-05T15:24:45" ) } );
db.so.insert( { date: new ISODate( "2013-08-05T15:25:15" ) } );
db.so.insert( { date: new ISODate( "2013-08-05T15:25:15" ) } );

db.so.aggregate( [
    { $group: {
        _id: {
            y: { '$year': '$date' },
            m: { '$month': '$date' },
            d: { '$dayOfMonth': '$date' },
            h: { '$hour': '$date' },
            i: { '$minute': '$date' },
        },
        count: { $sum : 1 }
    } } 
] );

哪个输出:

{
    "result" : [
        {
            "_id" : {
                "y" : 2013,
                "m" : 8,
                "d" : 5,
                "h" : 15,
                "i" : 25
            },
            "count" : 2
        },
        {
            "_id" : {
                "y" : 2013,
                "m" : 8,
                "d" : 5,
                "h" : 15,
                "i" : 24
            },
            "count" : 5
        }
    ],
    "ok" : 1
}
于 2013-08-05T15:31:43.647 回答