0

我有一个像这样的两个二进制字符串 10110 和 01111 的 MongoDB 集合

 { element_id:a, field_1:1, field_2:0, field_3:1, field_4:1, field_5:0} #binary string: 10110
 { element_id:b, field_1:0, field_2:1, field_3:1, field_4:1, field_5:1} #binary string: 01111

我想在 MongoDB 中查询候选二进制字符串“11111” ,但我的最小匹配(AND)值为 4(不是全部为 5)。这意味着只需要四个匹配一个位置即可从数据库中选择该文档。

所以预期的输出将是 - element_id:b

我在 MongoDB 网站或 Google 上找不到任何东西。任何人都可以帮忙吗?

4

3 回答 3

2

根据 Chien-Wei 早期的回答,MapReduce是一种很好的方法。在 MongoDB 2.2 中,您还可以考虑使用聚合框架

例如,如果您总是匹配 11111,那么您可以匹配$add感兴趣字段的值,然后只匹配$match至少有 4 个字段的值:

db.element.aggregate(
    // Could use an initial $match here to find candidate documents (using indexed query)

    // Use $project to add calculated total
    { $project: {
        _id: 0,
        element_id: 1,
        // Assume we are matching 11111 and field values are always 0 or 1
        total: { $add: [ "$field_1", "$field_2", "$field_3", "$field_4", "$field_5" ] }
    }},

    // Filter to interesting results (at least 4 fields with '1')
    { $match: {
        total : { $gte : 4 }
    }}
)

样本输出:

{ "result" : [ { "element_id" : "b", "total" : 4 } ], "ok" : 1 }

如果您想要更通用的比较,您可以使用$cond条件匹配目标数组,例如:

var targetArray = [1,1,1,1,1];
db.element.aggregate(
    // Could use an initial $match here to find candidate documents (using indexed query)

    // Use $project to add calculated total
    { $project: {
        _id: 0,
        element_id: 1,
        total: { $add: [
            { $cond:[{$eq:["$field_1", targetArray[0]]}, 1, 0 ]},
            { $cond:[{$eq:["$field_2", targetArray[1]]}, 1, 0 ]},
            { $cond:[{$eq:["$field_3", targetArray[2]]}, 1, 0 ]},
            { $cond:[{$eq:["$field_4", targetArray[3]]}, 1, 0 ]},
            { $cond:[{$eq:["$field_5", targetArray[4]]}, 1, 0 ]}
        ]}
    }},

    // Filter to interesting results (at least 4 fields with a match)
    { $match: {
        total : { $gte : 4 }
    }}
)

有关聚合选项和当前限制的一般比较,请参阅相关的 StackOverflow 问题:MongoDB 聚合比较:group()、$group 和 MapReduce

于 2012-11-28T13:13:02.397 回答
1

这是我的方法,虽然有点丑...

我使用map/reduce:(f是你的输入,你必须在函数中设置数组)

m = function() { 
    c=0; 
    f = [1,1,1,1,1]; 
    if(f[0]==this.field_1){c++;} 
    if(f[1]==this.field_2){c++;} 
    if(f[2]==this.field_3){c++;} 
    if(f[3]==this.field_4){c++;} 
    if(f[4]==this.field_5){c++;} 
    if(c>=4){
        emit(this.element_id, c)
    }
};

r = function(key, values) { return {key:values}; };

db.test.mapReduce(m, r, {out:{inline:1}})['results']

结果:

[ { "_id" : "b", "value" : 4 } ]
于 2012-11-28T09:49:00.673 回答
1

您可以使用修饰符以编程方式构建复杂查询,$or以匹配请求元素的所有可能组合:

buildQuery = function(arr){
  var N, i, j, query, subquery;
  N = arr.length;
  query = {$or: []};
  for (i = 1; i <= N; ++i) {
    subquery = {};
    for (j = 1; j <= N; ++j) {
      if (i === j) continue;
      subquery['field_' + j] = arr[j-1];
    }
    query.$or.push(subquery);
  }
  return query;
}

query = buildQuery([1,1,1,1,1]);
db.collection.find(query)

buildQuery输出将如下所示:

{ '$or': 
   [ { field_2: 1, field_3: 1, field_4: 1, field_5: 1 },
     { field_1: 1, field_3: 1, field_4: 1, field_5: 1 },
     { field_1: 1, field_2: 1, field_4: 1, field_5: 1 },
     { field_1: 1, field_2: 1, field_3: 1, field_5: 1 },
     { field_1: 1, field_2: 1, field_3: 1, field_4: 1 } ] }
于 2012-11-28T13:33:31.297 回答