14

MongoDB 中输出格式化的聚合函数有多灵活?

数据格式:

{
        "_id" : ObjectId("506ddd1900a47d802702a904"),
        "port_name" : "CL1-A",
        "metric" : "772.0",
        "port_number" : "0",
        "datetime" : ISODate("2012-10-03T14:03:00Z"),
        "array_serial" : "12345"
}

现在我正在使用这个聚合函数来返回一个 DateTime 数组、一个指标数组和一个计数:

{$match : { 'array_serial' : array, 
                            'port_name' : { $in : ports},
                            'datetime' : { $gte : from, $lte : to}
                        }
                },
               {$project : { port_name : 1, metric : 1, datetime: 1}},
               {$group : { _id : "$port_name", 
                            datetime : { $push : "$datetime"},
                            metric : { $push : "$metric"},
                            count : { $sum : 1}}}

这很好,而且非常快,但是有没有办法格式化输出,所以每个日期时间/指标都有一个数组?像这样:

[
    {
      "_id" : "portname",
      "data" : [
                ["2012-10-01T00:00:00.000Z", 1421.01],
                ["2012-10-01T00:01:00.000Z", 1361.01],
                ["2012-10-01T00:02:00.000Z", 1221.01]
               ]
    }
]

这将大大简化前端,因为这是图表代码所期望的格式。

4

3 回答 3

16

使用聚合框架将两个字段组合成一个值数组是可能的,但绝对不是那么简单(至少在 MongoDB 2.2.0 中)。

这是一个例子:

db.metrics.aggregate(

    // Find matching documents first (can take advantage of index)
    { $match : {
        'array_serial' : array, 
        'port_name' : { $in : ports},
        'datetime' : { $gte : from, $lte : to}
    }},

    // Project desired fields and add an extra $index for # of array elements
    { $project: {
        port_name: 1,
        datetime: 1,
        metric: 1,
        index: { $const:[0,1] }
    }},

    // Split into document stream based on $index
    { $unwind: '$index' },

    // Re-group data using conditional to create array [$datetime, $metric]
    { $group: {
        _id: { id: '$_id', port_name: '$port_name' },
        data: {
            $push: { $cond:[ {$eq:['$index', 0]}, '$datetime', '$metric'] }
        },
    }},

    // Sort results
    { $sort: { _id:1 } },

    // Final group by port_name with data array and count
    { $group: {
        _id: '$_id.port_name',
        data: { $push: '$data' },
        count: { $sum: 1 }
    }}
)
于 2012-10-09T03:51:47.637 回答
2

MongoDB 2.6 通过引入 使这更容易$map,它允许更简单的数组转置形式:

db.metrics.aggregate([
   { "$match": {
       "array_serial": array, 
       "port_name": { "$in": ports},
       "datetime": { "$gte": from, "$lte": to }
    }},
    { "$group": {
        "_id": "$port_name",
        "data": {
            "$push": {
                "$map": {
                    "input": [0,1],
                    "as": "index",
                    "in": {
                        "$cond": [
                            { "$eq": [ "$$index", 0 ] },
                            "$datetime",
                            "$metric"
                        ]
                    }
                }
            }
        },
        "count": { "$sum": 1 }
    }}
])

与 的方法非常相似$unwind,您将数组作为“输入”提供给由两个值组成的映射操作,然后通过操作将这些值替换为您想要的字段值$cond

这实际上消除了转换文档所需的所有管道杂耍,就像以前版本中所要求的那样,只是将实际聚合留给手头的工作,这基本上是按“port_name”值进行累积,并且转换为数组不再是问题区域。

于 2015-11-01T06:21:45.190 回答
1

在没有 $push 和 $addToSet 的聚合框架中构建数组似乎是缺乏的。我以前试过让它工作,但失败了。如果您可以这样做,那就太棒了:

data : {$push: [$datetime, $metric]}

在中$group,但这不起作用。

此外,像这样构建“文字”对象也行不通:

data : {$push: {literal:[$datetime, $metric]}}
or even data : {$push: {literal:$datetime}}

我希望他们最终能想出一些更好的方法来处理这类数据。

于 2012-10-08T19:54:59.007 回答