3

我收集了这样的文件:

{
    "_id" : ObjectId("5c0685fd6afbd73b80f45338"),
    "page_id" : "1234",
    "category_list" : [  
        "football", 
        "sport"
    ],
    "time_broadcast" : "09:13"
}

{
    "_id" : ObjectId("5c0685fd6afbd7355f45338"),
    "page_id" : "1234",
    "category_list" : [ 
        "sport",
        "handball"
    ],
    "time_broadcast" : "09:13"
}

{
    "_id" : ObjectId("5c0694ec6afbd74af41ea4af"),
    "page_id" : "123456",
    "category_list" : [ 
        "news", 
        "updates"
     ],
     "time_broadcast" : "09:13"
}

……

now = datetime.datetime.now().time().strftime("%H:%M")

我想要的是:当“time_broadcast”等于“now”时,我得到每个“page_id”的不同“category_list”列表。

以下是输出的样子:

{
   { 
     "page_id" : "1234",
     "category_list" : ["football", "sport", "handball"] 
   },

   { 
     "page_id" : "123456",
     "category_list" : ["news", "updates"] 
   }
}

我试过这样:

category_list = db.users.find({'time_broadcast': now}).distinct("category_list")

但这给了我不同值的输出列表,但是

所有“page_id”:

 ["football", "sport", "handball","news", "updates"] 

不是 page_id 的 category_list 。

请问有什么帮助吗?

谢谢

4

1 回答 1

3

你需要编写一个聚合管道

  • $match- 按标准过滤文档
  • $group- 按关键字段对文档进行分组
  • $addToSet- 聚合独特的元素
  • $project- 所需格式的项目
  • $reduce- 将数组数组减少为数组$concatArrays

聚合查询

db.tt.aggregate([
    {$match : {"time_broadcast" : "09:13"}}, 
    {$group : {"_id" : "$page_id", "category_list" : {$addToSet : "$category_list"}}}, 
    {$project : {"_id" : 0, "page_id" : "$_id", "category_list" : {$reduce : {input : "$category_list", initialValue : [], in: { $concatArrays : ["$$value", "$$this"] }}}}}
]).pretty()

结果

{ "page_id" : "123456", "category_list" : [ "news", "updates" ] }
{
        "page_id" : "1234",
        "category_list" : [
                "sport",
                "handball",
                "football",
                "sport"
        ]
}

如果需要,您可以$sort通过page_id管道添加

于 2018-12-18T15:49:39.103 回答