1

May be this is a silly question, but anyway I have the doubt.

Please take a look at this query:

db.posts.find({ "blog": "myblog", 
                "post_author_id": 649, 
                "shares.total": { "$gt": 0 } })
        .limit(10)
        .skip(1750)
        .sort({ "shares.total": -1, "tstamp_published": -1 });

actually I see into the mongodb profiler this report:

mongos> db.system.profile.find({ nreturned : { $gt : 1000 } }).limit(10).sort( { millis : 1 } ).pretty();
{
    "ts" : ISODate("2013-04-04T13:28:08.906Z"),
    "op" : "query",
    "ns" : "mydb.posts",
    "query" : {
        "$query" : {
            "blog" : "myblog",
            "post_author_id" : 649,
            "shares.total" : {
                "$gt" : 0
            }
        },
        "$orderby" : {
            "shares.total" : -1,
            "tstamp_published" : -1
        }
    },
    "ntoreturn" : 1760,
    "nscanned" : 12242,
    "scanAndOrder" : true,
    "nreturned" : 1760,
    "responseLength" : 7030522,
    "millis" : 126,
    "client" : "10.0.232.69",
    "user" : ""
}

Now the question is: why mongodb is returning 1760 documents when I have explicitly asked to skip 1750?

This is my current Mongodb version, in cluster/sharding.

mongos> db.runCommand("buildInfo")
{
    "version" : "2.0.2",
    "gitVersion" : "514b122d308928517f5841888ceaa4246a7f18e3",
    "sysInfo" : "Linux bs-linux64.10gen.cc 2.6.21.7-2.ec2.v1.2.fc8xen #1 SMP Fri Nov 20 17:48:28 EST 2009 x86_64 BOOST_LIB_VERSION=1_41",
    "versionArray" : [
        2,
        0,
        2,
        0
    ],
    "bits" : 64,
    "debug" : false,
    "maxBsonObjectSize" : 16777216,
    "ok" : 1
}
4

2 回答 2

1

现在的问题是:当我明确要求跳过 1750 时,为什么 mongodb 会返回 1760 文档?

因为服务器端正skip()是这样做的:它迭代前 1750 个结果,然后再获得 10 个(根据限制)。

正如@devesh 所说,这就是为什么应该避免非常大的分页,因为 MongoDB 没有有效地使用skip()or的索引limit()

于 2013-04-04T16:41:43.823 回答
0

我认为您已经中了靶心,我认为这就是为什么 mongoDB 文档要求我们避免大量跳过http://docs.mongodb.org/manual/reference/method/cursor.skip/的原因。请看这里它会回答你的结果。使用将与 $gt 运算符一起使用的其他键会快得多。就像第 1 页中最后一个键的日期时间戳一样,然后在日期时间上使用 $get。

cursor.skip() 方法通常很昂贵,因为它要求服务器在开始返回结果之前从集合或索引的开头步行以获取偏移量或跳过位置

于 2013-04-04T16:37:25.943 回答