4

我有一些问题mapreduce

我想对集合中的一些值进行分组、排序和计数。我有收藏,例如:

----------------------------
| item_id    |    date      |
----------------------------
| 1          | 01/15/2012   | 
----------------------------
| 2          | 01/01/2012   |
---------------------------- 
| 1          | 01/15/2012   |
----------------------------  
| 1          | 01/01/2012   |
----------------------------
| 2          | 01/03/2012   |
----------------------------
| 2          | 01/03/2012   |
----------------------------
| 1          | 01/01/2012   |
----------------------------
| 1          | 01/01/2012   |
----------------------------
| 2          | 01/01/2012   |
----------------------------
| 2          | 01/01/2012   |
----------------------------

我想按item_id日期对每个项目进行分组和计数,并对每个项目的日期进行排序并获得结果,例如:

value: {{item_id:1, date:{01/01/2012:3, 01/15/2012:2 }},{item_id:2, date:{01/01/2012:3, 01/03/2012:2 }}}

我使用mapReduce

m=function()
{
   emit(this.item_id, this.date);
}
r=function(key, values)
{
var res={};
values.forEach(function(v)
{
if(typeof res[v]!='undefined') ? res[v]+=1 : res[v]=1;
});
return res;
}

但我没有收到如下结果:

{{item_id:1, date:{01/01/2012:3, 01/15/2012:2 }},{item_id:2, date:{01/01/2012:3, 01/03/2012:2 }}}

有任何想法吗?

4

1 回答 1

2

给定表单的输入文档:

> db.dates.findOne()
{ "_id" : 1, "item_id" : 1, "date" : "1/15/2012" }
> 

以下 map 和 reduce 函数应该会产生您正在寻找的输出:

var map = function(){
    myDate = this.date;
    var value = {"item_id":this.item_id, "date":{}};
    value.date[myDate] = 1;
    emit(this.item_id, value);
}

var reduce = function(key, values){
    output = {"item_id":key, "date":{}};
    for(v in values){
        for(thisDate in values[v].date){
            if(output.date[thisDate] == null){
                output.date[thisDate] = 1;
            }else{
                output.date[thisDate] += values[v].date[thisDate];
            }
        }
    }
    return output;
}

> db.runCommand({"mapReduce":"dates", map:map, reduce:reduce, out:{replace:"dates_output"}})

> db.dates_output.find()
{ "_id" : 1, "value" : { "item_id" : 1, "date" : { "1/15/2012" : 2, "1/01/2012" : 3 } } }
{ "_id" : 2, "value" : { "item_id" : 2, "date" : { "1/01/2012" : 3, "1/03/2012" : 2 } } }

希望以上内容可以满足您的需求,或者至少可以让您指出正确的方向。

有关在 MongoDB 中使用 Map Reduce 的更多信息,请参阅 Mongo 文档: http ://www.mongodb.org/display/DOCS/MapReduce

MongoDB Cookbook 中有一些额外的 Map Reduce 示例:http: //cookbook.mongodb.org/

有关如何运行 Map Reduce 操作的分步演练,请参阅 MongoDB 食谱食谱“使用版本化文档查找最大值和最小值” http://cookbook.mongodb.org/patterns的“附加”部分/finding_max_and_min/

祝你好运!

于 2012-04-02T19:48:48.683 回答