我在 MongoDB 中有一个集合,其中包含以下文档。
/* 0 */
{
"T" : [
374135056604448742
],
"_id" : {
"#" : 7778532275691,
"ts" : ISODate("2013-07-26T02:25:00Z")
}
}
/* 1 */
{
"T" : [
1056188940167152853
],
"_id" : {
"#" : 34103385525388,
"ts" : ISODate("2013-07-30T03:00:00Z")
}
}
/* 2 */
{
"T" : [
1056188940167152853
],
"_id" : {
"#" : 34103385525388,
"ts" : ISODate("2013-07-30T03:18:00Z")
}
}
现在,我正在尝试使用以下查询查询一些文档。
db.entries.find({
'_id.ts': {'$gte': beginTS, '$lte': endTS},
'_id.#' : 884327843395156951
}).hint([('_id', 1)]).explain()
据我了解,由于 _id 是一个复合字段,而 Mongo 总是在 _id 上维护一个索引,因此要回答上述查询,Mongo 应该使用 '_id' 上的索引。但是,上述查询的答案如下:
{u'allPlans': [{u'cursor': u'BtreeCursor _id_',
u'indexBounds': {u'_id': [[{u'$minElement': 1}, {u'$maxElement': 1}]]},
u'n': 2803,
u'nscanned': 4869528,
u'nscannedObjects': 4869528}],
u'cursor': u'BtreeCursor _id_',
u'indexBounds': {u'_id': [[{u'$minElement': 1}, {u'$maxElement': 1}]]},
u'indexOnly': False,
u'isMultiKey': False,
u'millis': 128415,
u'n': 2803,
u'nChunkSkips': 0,
u'nYields': 132,
u'nscanned': 4869528,
u'nscannedAllPlans': 4869528,
u'nscannedObjects': 4869528,
u'nscannedObjectsAllPlans': 4869528,
u'scanAndOrder': False,
可以观察到,MongoDB 正在对 DB 进行一次完整的扫描,以查找少量文档。我不知道这里到底出了什么问题。
我尝试更改查询顺序,但结果相同。我不知道这里发生了什么。如果深表感谢,请提供任何帮助。
更新
我理解这里的细微差别。_id 不是复合索引,它只是一个精确的索引。这意味着如果 _id 是一个文档,那么无论文档的结构以及它可能有多少嵌套的 attrs 或子文档,_id 索引将只包含 _id 字段的一个条目。该条目假定为 _id 文档的哈希,并将保持唯一。