1

我有一个用户集合如下

{
    "id":"id here", 
    name: 'name here', 
    height: 'height here', 
    weight: 'weight here', 
    lastLogin:[array of login dates], 
    messagesSentOn: [array of messages sent date]
}

我需要找到所有上个月登录但不止一次的用户,以及上个月发送超过 25 条消息且体重超过 50 且身高超过 5 英寸的用户。对于上述情况,如何在 mongodb 中编写 map reduce 函数?

4

1 回答 1

1

我在 shell 中提供了一个示例。我不确定 MR 是解决这个问题的最佳解决方案,我鼓励您考虑替代解决方案以避免单线程 Javascript。例如,您可以存储一个仅包含当月登录信息或消息的附加字段。每次添加登录名和/或消息时,都会增加一个计数器字段。此模式将允许您在没有聚合命令的情况下找到匹配的文档。

您还应该研究新的聚合框架,它将在 MongoDB 版本 2.2(即将推出)中提供:http: //docs.mongodb.org/manual/applications/aggregation/

最后一点 - 为了提高性能,您应该确保在 MR 命令中包含一个查询以清除不匹配的文档(参见下面的示例)。

输入文件:

{ "_id" : 1, "name" : "Jenna", "height" : 100, "weight" : 51, "lastLogin" : [ 1, 2, 3, 4 ], "messageSentOn" : [ 4, 5, 5, 7 ] }
{ "_id" : 2, "name" : "Jim", "height" : 60, "weight" : 49, "lastLogin" : [ 2, 4 ], "messageSentOn" : [ 5, 6 ] }
{ "_id" : 3, "name" : "Jane", "height" : 90, "weight" : 60, "lastLogin" : [ 1 ], "messageSentOn" : [ 3, 6 ] }
{ "_id" : 4, "name" : "Joe", "height" : 70, "weight" : 65, "lastLogin" : [ 5, 6, 7 ], "messageSentOn" : [ 3, 6, 7 ] }

磁共振功能:

map = function(){ 
   var monthLogins = 0; 
   var monthMessages = 0; 
   var monthDate = 2;  
   for(var i=0; i<this.lastLogin.length; i++){     
       if(this.lastLogin[i] > monthDate){         
            monthLogins++; 
       } 
   } 
   for(var i=0; i<this.messageSentOn.length; i++){     
      if(this.messageSentOn[i] > monthDate){         
         monthMessages++; 
      } 
   } 
   if(monthLogins > 1 && monthMessages > 2)
      { emit(this._id, null); 
   } 
}

reduce = function (key, values) {
   //won't be called because a single document is emitted for each key
}

MR 命令:

db.collection.mapReduce(map, reduce, {query: {weight: {$gt : 50}, height: {$gt: 5}, lastLogin: {$gt: 2}}, out: {inline:1}})

输出:

{"_id" : 1, "value" : null},
{"_id" : 4, "value" : null}
于 2012-08-23T16:16:00.287 回答