我有一个查询,在对样本数据集执行一些聚合后,将以下示例视为中间数据;
fileid 字段包含文件的 id,用户数组包含用户数组,这些用户对相应文件进行了一些更改
{
“_id” : { “fileid” : 12 },
“_user” : [ “a”,”b”,”c”,”d” ]
}
{
“_id” : { “fileid” : 13 },
“_user” : [ “f”,”e”,”a”,”b” ]
}
{
“_id” : { “fileid” : 14 },
“_user” : [ “g”,”h”,”m”,”n” ]
}
{
“_id” : { “fileid” : 15 },
“_user” : [ “o”,”r”,”s”,”v” ]
}
{
“_id” : { “fileid” : 16 },
“_user” : [ “x”,”y”,”z”,”a” ]
}
{
“_id” : { “fileid” : 17 },
“_user” : [ “g”,”r”,”s”,”n” ]
}
我需要为此找到解决方案-> 任何两个用户对至少两个相同的文件进行了一些更改。所以输出结果应该是
{
“_id” : { “fileid” : [12,13] },
“_user” : [ “a”,”b”]
}
{
“_id” : { "fileid” : [14,17] },
“_user” : [ “g”,”n” ]
}
{
“_id” : { "fileid” : [15,17] },
“_user” : [ “r”,”s” ]
}
非常感谢您的意见。