0

我不了解这种 mongodb 行为,我的集合具有以下索引(为清楚起见,名称已简化)并且包含约 50k 个文档。

{
    "v" : 1,
    "key" : {
        "a" : 1,
        "b" : -1
    },
    "ns" : "db.articles",
    "name" : "a_1_b_-1",
    "background" : false,
    "dropDups" : false
}

以下查询

db.articles.find({ a: {"$in": ["foo", "bar"] } }).sort({b: -1}).limit(10).explain()

返回:

{
    "cursor" : "BtreeCursor a_1_b_-1 multi",
    "isMultiKey" : false,
    "n" : 10,
    "nscannedObjects" : 20,
    "nscanned" : 21,
    "nscannedObjectsAllPlans" : 68,
    "nscannedAllPlans" : 105,
    "scanAndOrder" : true,
    "indexOnly" : false,
    "nYields" : 0,
    "nChunkSkips" : 0,
    "millis" : 0,
    "indexBounds" : {
        "a" : [
            [
                "foo",
                "foo"
            ],
            [
                "bar",
                "bar"
            ]
        ],
        "b" : [
            [
                {
                    "$maxElement" : 1
                },
                {
                    "$minElement" : 1
                }
            ]
        ]
    },
    "server" : "localhost:27017"
}

“scanAndOrder”为真,表示索引中的顺序不能用于对返回集进行排序。这意味着当给定偏移量(即跳过 10000)时,查询将阻塞,随后将返回“sort() 没有索引的数据过多。添加索引或指定更小的限制”。当查询更改为仅执行一次相等检查时,索引将按预期使用:

db.articles.find({ a: "foo" }).sort({b: -1}).limit(10).explain()

结果集顺序现在是文档在索引中的顺序:

"scanAndOrder" : false

所以它似乎与“$in”运算符在索引查找中的行为方式有关?

4

1 回答 1

1

MongoDB 中的复合索引存储在树状数据结构中,例如,假设我们在ab字段上创建索引,对于 的每个值a都会有关联的b值列表。

BTree游标的$in运算符返回a值的引用列表,因此sort运算符必须在排序之前合并多个b值列表,之后不能使用索引。

于 2013-09-12T13:50:11.400 回答