0

我目前正在使用 MongoDB 的 MapReduce 生成每小时广告查看次数,如下所示:

{ _id : "4/1/2011 9:00 AM", value : { AdViews_Total : 4 } }

这很好用,我在一个集合中得到结果,随后我可以比原始数据更快地查询。现在,我想做的是这样的:

{ _id : "4/1/2011 9:00 AM", value : { ByBrowser : { "Internet Explorer" : 4, "FireFox" : 4 } } }

为此,我认为我需要能够在 Reduce 操作中合并两个或多个不相交的文档,例如:

{ _id : "4/1/2011 9:00 AM", value : { ByBrowser : { "FireFox" : 3 } } }
{ _id : "4/1/2011 9:00 AM", value : { ByBrowser : { "FireFox" : 1 } } }
{ _id : "4/1/2011 9:00 AM", value : { ByBrowser : { "Internet Explorer" : 4 } } }

有谁知道这样的 Reduce 操作可能是什么样子,请记住浏览器名称事先不知道?

4

1 回答 1

1

在使用以下内容后,我已经设法实现了我的目标,尽管我怀疑可能有更有效的方法来做到这一点。在标记为答案之前,我会将其保留一天...

function Reduce(key, arr_values) {
    var reduced = { 
        AdViews_Total : 0, 
        DefaultAdViews_Total : 0, 
        Sessions_Total : 0,
        Browsers : [ ],
        }; //a document
    for(var i in arr_values) {
        reduced.AdViews_Total += isNaN(arr_values[i].AdViews_Total) ? 0 : arr_values[i].AdViews_Total;
        reduced.DefaultAdViews_Total += isNaN(arr_values[i].DefaultAdViews_Total) ? 0 : arr_values[i].DefaultAdViews_Total;
        reduced.Sessions_Total += isNaN(arr_values[i].Sessions_Total) ? 0 : arr_values[i].Sessions_Total;
        if (null != arr_values[i].Browsers)
            for (var j in arr_values[i].Browsers)
            {
                var browser = arr_values[i].Browsers[j]
                var browserLabel = browser.Browser;
                var browserCount = browser.Count;
                var browserFound = false;
                for (var k in reduced.Browsers)
                {
                    if (reduced.Browsers[k].Browser == browserLabel)
                    {
                        reduced.Browsers[k].Count += browserCount;
                        browserFound = true;
                    }
                }
                if (!browserFound)
                    reduced.Browsers[0] = browser;
            }
    }
    return reduced;
}
于 2011-06-17T02:09:09.080 回答