2

好吧,我正在尝试将此 sql 查询翻译为 map reduce

select
    o_orderpriority, 
    count(*) as order_count
from 
    orders
where 
    o_orderdate >= date '1993-07-01'
    and o_orderdate < date '1993-07-01' + interval '3' month
    and exists (
        select 
        *
        from 
        lineitem
        where 
        l_orderkey = o_orderkey
        and l_commitdate < l_receiptdate
    )
group by 
    o_orderpriority
order by 
    o_orderpriority;

我尝试了以下地图减少功能

    db.runCommand({
    mapreduce: "orders",
    query: {
        o_orderdate: {'$gte': new Date("July 01, 1993")},
        o_orderdate: {'$lt': new Date("Oct 01, 1993")}
    },
    map: function Map() {
            for(var i in this.o_lineitem) {
                if( this.o_lineitem[i].l_commitdate < this.o_lineitem[i].l_receiptdate) {
                    var o_orderpriority = this.o_lineitem[i].o_orderpriority;
                    emit( o_orderpriority, {count: 1} );
                }
            }
        },
    reduce: function(key, values) {
                var count= 0;
                for (var i = 0; i < values.length; i++) {
                    count+= values[i];
                }
                return count;
            },
    out: 'query004'
});

当 ai 运行时,我会收到以下警报

Sat Aug 11 20:44:32 SyntaxError: missing ) after condition (shell):9

对我来说,没有 ) 丢失,是吗?

我做了@Stenie指出的更正,但现在ai有以下问题

{
        "assertion" : "value too large to reduce",
        "assertionCode" : 13070,
        "errmsg" : "db assertion failure",
        "ok" : 0
}
4

1 回答 1

3

问题是你的发射和你的减少函数不返回相同的东西。

您的 map 函数发出值:

{count: 1}

这意味着您的 reduce 必须返回相同的格式。

您在 reduce 中返回一个简单的值:

return count;

您可以将您的 emit 更改为仅发出 1 而不是 JSON 文档,然后您不必更改您的 reduce,否则更改您的 reduce 以返回 JSON 文档 {count: X},其中 X 是计算的计数。

仅供参考,这导致错误“值太大而无法减少”的原因是,一旦你像这样混合你的类型,'+' 运算符开始连接你的值而不是添加它们,最终它变得太大。要了解如何调试它,我推荐 MapReduce 故障排除页面

于 2012-08-12T21:19:19.087 回答