3

我有一个 mongodb/mongoskin 聚合请求,如下所示:

db.collection(customerTable + '_earnedinfluencers').aggregate([
    {
        $group: {
            _id: '$user',
            name: '', // to be filled separately
            username: '', // to be filled separately 
            picture: '', // to be filled separately
            city: '', // to be filled separately
            kids: { $sum: '$kids' },
            revenue: { $sum: '$dayIncome' },
            kidsRevRatio: { $divide: [ { $sum: '$kids' }, { $sum: '$dayIncome' } ] }
        }, 

        $match: {
            richness: { $gte: variable1 },
            kids: { $lt: variable2 },
            hobbies: { $in: ['hobby1', 'hobby2', 'hobby3', 'hobby4'] },
            event: { $in: schoolfestival },
            event: { $ne: 0 }
        },

        $project: {
            _id: 0,
            user: '$_id',
            name: 1,
            username: 1,
            picture: 1,
            city: 1,
            kids: 1,
            revenue: 1,
            kidsRevRatio: 1
        }
    }
], function(err, result) {
    // do something with err and result
});

上面的代码给出了以下错误:

Error: {"name":"MongoError","errmsg":"exception: A pipeline stage specification object must contain exactly one field.","code":16435,"ok":0}

一般来说,我是 mongo 和 db 的新手,不知道我做错了什么。

4

1 回答 1

11

您的管道参数不平衡,每个阶段都是一个单独的文档,因此您需要包装每个阶段。但也存在许多其他问题

db.collection(customerTable + '_earnedinfluencers').aggregate([

    { $match: {
            richness: { $gte: variable1 },
            kids: { $lt: variable2 },
            hobbies: { $in: ['hobby1', 'hobby2', 'hobby3', 'hobby4'] },
            event: { $in: schoolfestival },
    }},

    { $group: {
            _id: '$user',
            name: { '$first': '$name' },
            username: { '$first': '$username' },
            picture: { '$first': '$picture' },
            city: { '$first': '$city' }
            kids: { '$sum': '$kids' },
            revenue: { '$sum': '$dayIncome' },
            kidsSum: { '$sum': '$kids' },
    }}, 


    { $project: {
            _id: 0,
            user: '$_id',
            name: 1,
            username: 1,
            picture: 1,
            city: 1,
            revenue: 1,
            kidsSum: 1,
            kidsRevRatio: { $divide: [ '$kidsSum', '$revenue' ] }
    }}
], function(err, result) {
    // do something with err and result
});

您将整个管道作为一个文档,实际上它需要一组文档,如图所示。

但你真的想$match先过滤你的结果。如果你真的想在一个组之后做一些额外的匹配,那么你之后会在管道中添加一个额外的匹配。

$group操作要求分组键之外的所有字段都_id需要有一个“分组运算符”,除非它们是您分组的一部分,否则您不能仅凭自己的字段取回字段_id。通常,您需要一个运算符,例如$first或以其他方式完全省略它们。

仅限顶级分组运算符,因此类似$divide的操作不是分组运算符。为了在处理一个或多个结果时执行此类操作,您可以使用具有计算值的字段$sum将其移至稍后。$project

项目和组等操作也会从管道中“删除”字段,并且只保留您特别包含的字段。所以你不能指定一个不存在的字段。这就是为什么$match首先出现的原因之一,也是您可以使用索引的地方,并且只有在管道开始时才能这样做。

但是对于每个阶段,唯一存在的领域将是提到的那些。作为进一步的优化,“优化器”从一开始就不包括文档中没有特别提及的任何字段。因此,只有在第一场比赛和小组阶段组合中引用的那些才会被包括在其余的管道阶段中,然后可能会再次被过滤掉。

于 2014-08-18T23:16:46.703 回答