我正在尝试编写一个聚合来识别使用多个付款来源的帐户。典型的数据是。
{
account:"abc",
vendor:"amazon",
}
...
{
account:"abc",
vendor:"overstock",
}
现在,我想生成一个与此类似的帐户列表
{
account:"abc",
vendorCount:2
}
我将如何在 Mongo 的聚合框架中编写这个
我正在尝试编写一个聚合来识别使用多个付款来源的帐户。典型的数据是。
{
account:"abc",
vendor:"amazon",
}
...
{
account:"abc",
vendor:"overstock",
}
现在,我想生成一个与此类似的帐户列表
{
account:"abc",
vendorCount:2
}
我将如何在 Mongo 的聚合框架中编写这个
我通过使用 $addToSet 和 $unwind 运算符解决了这个问题。
db.collection.aggregate([
{
$group: { _id: { account: '$account' }, vendors: { $addToSet: '$vendor'} }
},
{
$unwind:"$vendors"
},
{
$group: { _id: "$_id", vendorCount: { $sum:1} }
}
]);
希望它可以帮助某人
我认为如果您执行如下查询会更好,这将避免展开
db.t2.insert({_id:1,account:"abc",vendor:"amazon"});
db.t2.insert({_id:2,account:"abc",vendor:"overstock"});
db.t2.aggregate(
{ $group : { _id : { "account" : "$account", "vendor" : "$vendor" }, number : { $sum : 1 } } },
{ $group : { _id : "$_id.account", number : { $sum : 1 } } }
);
这将向您显示预期的以下结果。
{ "_id" : "abc", "number" : 2 }
您可以使用sets
db.test.aggregate([
{$group: {
_id: "$account",
uniqueVendors: {$addToSet: "$vendor"}
}},
{$project: {
_id: 1,
vendorsCount: {$size: "$uniqueVendors"}
}}
]);
我不明白为什么有人必须使用 $group 两次
db.t2.aggregate([ { $group: {"_id":"$account" , "number":{$sum:1}} } ])
这将完全正常。
这种方法不使用 $unwind 和其他额外的操作。另外,如果将新事物添加到聚合中,这不会影响任何事情。接受的答案存在缺陷。如果您在 $group 中有其他累积字段,则会导致已接受答案的 $unwind 阶段出现问题。
db.collection.aggregate([{
"$group": {
"_id": "$account",
"vendors": {"$addToSet": "$vendor"}
}
},
{
"$addFields": {
"vendorCount": {
"$size": "$vendors"
}
}
}])
要识别使用多个付款来源的帐户:
db.payment_collection.aggregate([ { $group: {"_id":"$account" , "number":{$sum:1}} }, { "$match": { "number": { "$gt": 1 } } } ])
这将工作得很好,
db.UserModule.aggregate(
{ $group : { _id : { "companyauthemail" : "$companyauthemail", "email" : "$email" }, number : { $sum : 1 } } },
{ $group : { _id : "$_id.companyauthemail", number : { $sum : 1 } } }
);
一个例子
db.collection.distinct("example.item").forEach( function(docs) {
print(docs + "==>>" + db.collection.count({"example.item":docs}))
});