7

我在 MongoDB 中有一个集合,其中包含以下文档。

/* 0 */
{
    "T" : [ 
        374135056604448742
    ],
    "_id" : {
        "#" : 7778532275691,
        "ts" : ISODate("2013-07-26T02:25:00Z")
    }
}

/* 1 */
{
    "T" : [ 
        1056188940167152853
    ],
    "_id" : {
        "#" : 34103385525388,
        "ts" : ISODate("2013-07-30T03:00:00Z")
    }
}

/* 2 */
{
    "T" : [ 
        1056188940167152853
    ],
    "_id" : {
        "#" : 34103385525388,
        "ts" : ISODate("2013-07-30T03:18:00Z")
    }
}

现在,我正在尝试使用以下查询查询一些文档。

db.entries.find({
    '_id.ts': {'$gte': beginTS, '$lte': endTS}, 
    '_id.#' : 884327843395156951
    }).hint([('_id', 1)]).explain()

据我了解,由于 _id 是一个复合字段,而 Mongo 总是在 _id 上维护一个索引,因此要回答上述查询,Mongo 应该使用 '_id' 上的索引。但是,上述查询的答案如下:

{u'allPlans': [{u'cursor': u'BtreeCursor _id_',
   u'indexBounds': {u'_id': [[{u'$minElement': 1}, {u'$maxElement': 1}]]},
   u'n': 2803,
   u'nscanned': 4869528,
   u'nscannedObjects': 4869528}],
 u'cursor': u'BtreeCursor _id_',
 u'indexBounds': {u'_id': [[{u'$minElement': 1}, {u'$maxElement': 1}]]},
 u'indexOnly': False,
 u'isMultiKey': False,
 u'millis': 128415,
 u'n': 2803,
 u'nChunkSkips': 0,
 u'nYields': 132,
 u'nscanned': 4869528,
 u'nscannedAllPlans': 4869528,
 u'nscannedObjects': 4869528,
 u'nscannedObjectsAllPlans': 4869528,
 u'scanAndOrder': False,

可以观察到,MongoDB 正在对 DB 进行一次完整的扫描,以查找少量文档。我不知道这里到底出了什么问题。

我尝试更改查询顺序,但结果相同。我不知道这里发生了什么。如果深表感谢,请提供任何帮助。

更新

我理解这里的细微差别。_id 不是复合索引,它只是一个精确的索引。这意味着如果 _id 是一个文档,那么无论文档的结构以及它可能有多少嵌套的 attrs 或子文档,_id 索引将只包含 _id 字段的一个条目。该条目假定为 _id 文档的哈希,并将保持唯一。

4

1 回答 1

6

您正在使用对象作为键,但这里没有使用复合索引

_id索引有点特殊,因为它是自动创建的,并且始终是唯一的。通常,_id索引是一个ObjectId、 aUUID或者可能是integer一个包含某种散列的字符串。MongoDB 支持复杂对象作为键。但是,对于 MongoDB,这仍然只是一个文档。它可以与其他文档进行比较,具有相同字段和值的文档将是相等的。但是由于您没有创建索引键(并且您不能手动创建该索引),MongoDB 不知道它包含一个 field#和一个 field ts

另一方面,复合索引明确地引用文档的字段,例如{"product.quantity" : 1, "product.created" : -1}。这必须在创建索引时指定。

看来您基本上是在尝试在主键中存储时间戳。MongoDBObjectId已经包含一个时间戳,因此您可以ObjectIds直接进行基于日期的范围查询。

于 2013-08-22T21:03:09.500 回答