mongodb - Mongodb scanAndOrder 索引意外行为

Question

我不了解这种 mongodb 行为，我的集合具有以下索引（为清楚起见，名称已简化）并且包含约 50k 个文档。

{
    "v" : 1,
    "key" : {
        "a" : 1,
        "b" : -1
    },
    "ns" : "db.articles",
    "name" : "a_1_b_-1",
    "background" : false,
    "dropDups" : false
}

以下查询

db.articles.find({ a: {"$in": ["foo", "bar"] } }).sort({b: -1}).limit(10).explain()

返回：

{
    "cursor" : "BtreeCursor a_1_b_-1 multi",
    "isMultiKey" : false,
    "n" : 10,
    "nscannedObjects" : 20,
    "nscanned" : 21,
    "nscannedObjectsAllPlans" : 68,
    "nscannedAllPlans" : 105,
    "scanAndOrder" : true,
    "indexOnly" : false,
    "nYields" : 0,
    "nChunkSkips" : 0,
    "millis" : 0,
    "indexBounds" : {
        "a" : [
            [
                "foo",
                "foo"
            ],
            [
                "bar",
                "bar"
            ]
        ],
        "b" : [
            [
                {
                    "$maxElement" : 1
                },
                {
                    "$minElement" : 1
                }
            ]
        ]
    },
    "server" : "localhost:27017"
}

“scanAndOrder”为真，表示索引中的顺序不能用于对返回集进行排序。这意味着当给定偏移量（即跳过 10000）时，查询将阻塞，随后将返回“sort() 没有索引的数据过多。添加索引或指定更小的限制”。当查询更改为仅执行一次相等检查时，索引将按预期使用：

db.articles.find({ a: "foo" }).sort({b: -1}).limit(10).explain()

结果集顺序现在是文档在索引中的顺序：

"scanAndOrder" : false

所以它似乎与“$in”运算符在索引查找中的行为方式有关？

score 1 · Accepted Answer

MongoDB 中的复合索引存储在树状数据结构中，例如，假设我们在a和b字段上创建索引，对于的每个值a都会有关联的b值列表。

BTree游标的$in运算符返回a值的引用列表，因此sort运算符必须在排序之前合并多个b值列表，之后不能使用索引。

mongodb - Mongodb scanAndOrder 索引意外行为

1 回答 1

Related

Reference