我不了解这种 mongodb 行为,我的集合具有以下索引(为清楚起见,名称已简化)并且包含约 50k 个文档。
{
"v" : 1,
"key" : {
"a" : 1,
"b" : -1
},
"ns" : "db.articles",
"name" : "a_1_b_-1",
"background" : false,
"dropDups" : false
}
以下查询
db.articles.find({ a: {"$in": ["foo", "bar"] } }).sort({b: -1}).limit(10).explain()
返回:
{
"cursor" : "BtreeCursor a_1_b_-1 multi",
"isMultiKey" : false,
"n" : 10,
"nscannedObjects" : 20,
"nscanned" : 21,
"nscannedObjectsAllPlans" : 68,
"nscannedAllPlans" : 105,
"scanAndOrder" : true,
"indexOnly" : false,
"nYields" : 0,
"nChunkSkips" : 0,
"millis" : 0,
"indexBounds" : {
"a" : [
[
"foo",
"foo"
],
[
"bar",
"bar"
]
],
"b" : [
[
{
"$maxElement" : 1
},
{
"$minElement" : 1
}
]
]
},
"server" : "localhost:27017"
}
“scanAndOrder”为真,表示索引中的顺序不能用于对返回集进行排序。这意味着当给定偏移量(即跳过 10000)时,查询将阻塞,随后将返回“sort() 没有索引的数据过多。添加索引或指定更小的限制”。当查询更改为仅执行一次相等检查时,索引将按预期使用:
db.articles.find({ a: "foo" }).sort({b: -1}).limit(10).explain()
结果集顺序现在是文档在索引中的顺序:
"scanAndOrder" : false
所以它似乎与“$in”运算符在索引查找中的行为方式有关?