1

我在 MongoDB 中使用 mapReduce 为来自他/她的朋友网络的用户生成趋势歌曲。所以我遍历所有用户并检查 user_id 是否存在于他们的朋友数组中,如果存在我发出他们的歌曲然后合并整个发出的歌曲以找到他所有朋友网络的热门歌曲。

问题是我需要遍历所有用户以找到集合中每个用户的(网络趋势歌曲)。我怎样才能做到这一点,有没有像嵌套 mapReduce 这样的方法。还是我必须从应用程序层进行迭代,例如通过 for 循环执行 mapReduce!

我当前使用的 mapReduce 是这个:

var map = function() {
users = [];
songs = [];
    if(this.value.friends !== undefined && this.value.friends.length !== 0 && this.value.songs !== undefined && this.value.songs.length !== 0){
        key = this._id.user_id;
        for(var x=0; x<this.value.songs.length; x++)
            emit({user_id:user_id,song_id:this.value.songs[x][0]},{played:this.value.songs[x][1], counter:1});
    }
};
var reduce = function(key, values) {
    var counter = 0;
    var played = 0;
    values.forEach(function(val){
        counter += val.counter;
        played += val.played;
    });
    return {played : played, counter : counter};
};
db.runCommand({"mapreduce":"trending_users", "map":map, "reduce":reduce, "scope":{user_id: "111222333444"} ,"query":{'value.friends':{$in : ['111222333444'] }},'out':{merge:'trending_user_network'}})    
db.trending_user_network.find({'_id.user_id':'111222333444'}).sort({'value.counter':-1, 'value.played':-1})
4

1 回答 1

0

您当然可以在应用程序中使用 for 循环来循环遍历用户 ID 并为每个用户 ID 运行 map reduce。但是,对于这样的事情,您可能会更幸运地使用聚合框架来创建聚合操作的管道来一次完成所有操作。

我不知道您的架构的确切细节,但我认为您可以按照以下方式构建一个聚合管道:

  • $unwind获取映射到他们朋友的用户 ID 的用户的平面列表
  • $unwind再次将朋友的用户 ID 映射到他们的歌曲列表
  • $group获取结果列表中每首歌曲的聚合
  • $sort把结果整理好

实际上,您的管道可能需要更多步骤,但我认为如果您从聚合而不是 map-reduce 的角度来看待这个问题,它会更容易。

于 2012-09-28T16:11:48.267 回答