2

我有一个集合,我想在其中找到给定字段的所有重复项。从这里的 Mongo 文档和其他答案来看,大多数人似乎建议使用 mapReduce。我想知道从 python 中迭代游标而不是使用 map reduce 有什么缺点。

无论如何,似乎 mapreduce 也必须遍历对象。

在此处添加解决方案,这样可能会对某人有所帮助。

我运行以下查询以获取不止一次出现的所有条形码的列表。$group管道计算出现的次数,并$match过滤count超过 的次数1

db.sandbox.aggregate([
                      {$group: {_id: '$barcode',
                                count: {$sum: 1}
                               }
                      },
                      {$match: {count: {$gt:1} } }
                     ])
4

1 回答 1

4

聚合框架将帮助您找到重复项。它比获取记录和循环更好。

于 2013-06-04T12:03:10.863 回答