我正在使用 MongoDB,最终得到了两个集合(无意中)。
第一个集合(样本)有 1 亿条记录(推文),结构如下:
{
"_id" : ObjectId("515af34297c2f607b822a54b"),
"text" : "bla bla ",
"id" : NumberLong("314965680476803072"),
"user" :
{
"screen_name" : "TheFroooggie",
"time_zone" : "Amsterdam",
},
}
来自推文集合的第二个集合(用户)有 3000 万条唯一用户记录,它看起来像这样
{ "_id" : "000000_n", "target" : 1, "value" : { "count" : 5 } }
其中 users 集合中的 _id 是 tweets 集合中的 user.screen_name ,目标是他们的状态(是否是垃圾邮件发送者),最后 value.count 是用户出现在我们的第一个集合(样本)集合中的数量(例如 number捕获的推文)
现在我想进行以下查询:
我想从用户的目标值 = 1 的示例集合(推文)中返回所有文档
换句话说,例如,我想返回所有垃圾邮件发送者的所有推文。