35

在 MongoDB 聚合框架中,我希望在对象(即 JSON 集合)上使用 $unwind 运算符。看起来这不可能,有解决方法吗?有计划实施吗?

例如,从聚合文档中获取文章集合。假设有一个附加字段“ratings”,它是来自 user -> rating 的映射。你能计算出每个用户的平均评分吗?

除此之外,我对聚合框架非常满意。

更新:这是我每个请求的 JSON 集合的简化版本。我正在存储基因组数据。我不能真正使基因型成为一个数组,因为最常见的查找是获取随机人的基因型。

variants: [

    {
        name: 'variant1', 
        genotypes: {

            person1: 2,
            person2: 5,
            person3: 7,

        }
    }, 

    {
        name: 'variant2', 
        genotypes: {

            person1: 3,
            person2: 3,
            person3: 2,

        }
    }

]
4

4 回答 4

32

使用聚合框架无法进行您描述的计算类型 - 这不是因为没有$unwind非数组的方法。即使 person:value 对象是数组中的文档,$unwind也无济于事。

“分组依据”功能(无论是在 MongoDB 中还是在任何关系数据库中)都是在字段或列的值上完成的。我们根据另一个字段的值按字段值和总和/平均值/等进行分组。

简单示例是您建议的变体,将评级字段添加到示例文章集合中,但不是作为从用户到评级的映射,而是作为这样的数组:

{ title : title of article", ...
  ratings: [
         { voter: "user1", score: 5 },
         { voter: "user2", score: 8 },
         { voter: "user3", score: 7 }
  ]
}

现在您可以将其汇总为:

[ {$unwind: "$ratings"},
  {$group : {_id : "$ratings.voter", averageScore: {$avg:"$ratings.score"} } } 
]

但是这个例子的结构如你所描述的那样看起来像这样:

{ title : title of article", ...
  ratings: {
         user1: 5,
         user2: 8,
         user3: 7
  }
}

甚至这个:

{ title : title of article", ...
  ratings: [
         { user1: 5 },
         { user2: 8 },
         { user3: 7 }
  ]
}

即使你能做到$unwind这一点,这里也没有什么可以汇总的。除非您知道所有可能的密钥(用户)的完整列表,否则您无法对此做太多事情。[*]

与您所拥有的类似的关系数据库模式是:

CREATE TABLE T (
   user1: integer,
   user2: integer,
   user3: integer
   ...
);

这不是要做的事情,而是我们会这样做:

CREATE TABLE T (
   username: varchar(32),
   score: integer
);

现在我们使用 SQL 进行聚合:

select username, avg(score) from T group by username;

有一个对 MongoDB 的增强请求,可能允许您将来在聚合框架中执行此操作 - 将值投影到键的能力,反之亦然。同时,总是有map/reduce。

[*] 如果您知道所有唯一键(您可以使用与此类似的方法找到所有唯一键),则有一种复杂的方法可以做到这一点,但是如果您知道所有键,您也可以只运行一系列查询每个 userX 的表单db.articles.find({"ratings.user1":{$exists:true}},{_id:0,"ratings.user1":1})将返回他们的所有评分,您可以简单地对它们进行求和和平均,而不是进行聚合框架所需的非常复杂的投影。

于 2012-07-08T17:12:46.057 回答
11

从 3.4.4 开始,您可以使用 $objectToArray 将对象转换为数组

请参阅: https ://docs.mongodb.com/manual/reference/operator/aggregation/objectToArray/

于 2017-09-28T21:20:03.323 回答
1

这是一个老问题,但我通过反复试验发现了一些人们可能会觉得有用的信息。

实际上可以通过以这种方式欺骗解析器来解除虚拟值:

db.Opportunity.aggregate(
  { $project: {
        Field1: 1, Field2: 1, Field3: 1,
        DummyUnwindField: { $ifNull: [null, [1.0]] }
    }
  },
  { $unwind: "$DummyUnwindField" }
);

无论值是否存在,这将为每个文档生成 1 行。您可以对此进行修改以生成您想要的结果。我曾希望将它与多个 $unwinds 结合起来(有点像 map/reduce 中的 emit() ),但是唉,最后一个 $unwind 获胜,或者它们组合成一个交集而不是联合,这使得我无法实现我的结果正在寻找。我对聚合框架功能感到非常失望,因为它不适合我希望使用它的一个用例(奇怪的是,这方面 StackOverflow 上的很多问题都在问) - 根据匹配排序结果速度。改善糟糕的地图缩减性能将使整个功能变得不必要。

于 2013-02-08T05:03:51.120 回答
0

这就是我发现和扩展的。

让我们在 mongo 中创建实验数据库

db.copyDatabase('livedb' , 'experimentdb')

现在使用experimentdb & 将数组转换为你的experimentcollection 中的对象

db.getCollection('experimentcollection').find({}).forEach(function(e){
    if(e.store){
        e.ratings = [e.ratings]; //Objects name to be converted to array eg:ratings
        db.experimentcollection.save(e);
    }
})

一些将 json 转换为平面对象的 nerdy js 代码

var flatArray = [];

var data = db.experimentcollection.find().toArray();

for (var index = 0; index < data.length; index++) {

  var flatObject = {};

  for (var prop in data[index]) {

    var value = data[index][prop];

    if (Array.isArray(value) && prop === 'ratings') {
      for (var i = 0; i < value.length; i++) {
        for (var inProp in value[i]) {
          flatObject[inProp] = value[i][inProp];
        }
      }
    }else{
        flatObject[prop] = value;
    }
  }
  flatArray.push(flatObject);
}

printjson(flatArray);
于 2017-06-22T09:43:12.813 回答