1

我正在使用 Map Reduce。问题是,如果没有。文件的输入> 100,那么我没有得到预期的数字。结果,但如果没有。输入文档的数量 <= 100,然后我得到了预期的结果。

我得到的示例输出:

{
    "_id" : "5504",
    "value" : [
            ObjectId("51c921bae4b0f0f776b339d2"),
            ObjectId("51b06b5be4b021e44bc69755")
    ]
}

问题:如果用户 (id:5504) 有 <= 100 个文档,那么我得到的不是那么多。输出数组中的 ids 但如果不是。> 100 的文档,那么我在输出数组中得到的 id 很少。没有时我得到了上述输出。该用户的文档数是 101,但是当它是 100 时,我得到了 100 个 ID。为什么会出现这种奇怪的行为以及解决方案是什么?

地图功能:

db.system.js.save({

    _id: "map1",

    value: function () {
        var value = {
            "data": [{
                "_id": this._id,
                "creation_time": this.creation_time
            }]
        };
        emit(this.user_id, value);
    }
});

减少功能:

db.system.js.save({

    _id: "reduce1",

    value: function (key, values) {
        var reducedValue = [];
        for (var i = 0; i < values.length; i++) {
            reducedValue.push({
                "_id": values[i].data[0]._id,
                "creation_time": values[i].data[0].creation_time
            });
        }
        return {
            data: reducedValue
        };
    }
});

完成功能:

db.system.js.save({

    _id: "finalize1",

    value: function (key, reducedValue) {
        var a = reducedValue.data.sort(compare1);
        var ids = [];
        for (var i = 0; i < a.length; i++) {
            ids.push(a[i]._id);
        }
        return ids;
    }
});

比较功能:

db.system.js.save({

    _id: "compare1",

    value: function (a, b) {
        if (a.creation_time < b.creation_time) return 1;
        if (a.creation_time > b.creation_time) return -1;
        return 0;
    }
});

MapReduce() 调用

db.notifications.mapReduce(map1, reduce1, {out: "notifications_result", query: {delivered:true, user_id:"5504"}, finalize: finalize1});
4

1 回答 1

1

由于 MongoDB 可以多次调用 reduce 函数,所以必须保证Function Idempotence。对 reduce 函数稍作修改即可解决问题:

db.system.js.save({

    _id: "reduce1",

    value: function (key, values) {
        var reducedValue = [];
        for (var i = 0; i < values.length; i++) {
            for(var j = 0; j < values[i].data.length; j++) {
                reducedValue.push({
                    "_id": values[i].data[j]._id,
                    "creation_time": values[i].data[j].creation_time
                });   
            }

        }
        return {
            data: reducedValue
        };
    }
});

请注意,现在values[i].data数组也被遍历了,因为其他reduce1调用的返回都在values数组中。

于 2013-07-05T12:27:38.927 回答