mongodb - MongoDB 未在“_id”上使用复合索引

Question

我在 MongoDB 中有一个集合，其中包含以下文档。

/* 0 */
{
    "T" : [ 
        374135056604448742
    ],
    "_id" : {
        "#" : 7778532275691,
        "ts" : ISODate("2013-07-26T02:25:00Z")
    }
}

/* 1 */
{
    "T" : [ 
        1056188940167152853
    ],
    "_id" : {
        "#" : 34103385525388,
        "ts" : ISODate("2013-07-30T03:00:00Z")
    }
}

/* 2 */
{
    "T" : [ 
        1056188940167152853
    ],
    "_id" : {
        "#" : 34103385525388,
        "ts" : ISODate("2013-07-30T03:18:00Z")
    }
}

现在，我正在尝试使用以下查询查询一些文档。

db.entries.find({
    '_id.ts': {'$gte': beginTS, '$lte': endTS}, 
    '_id.#' : 884327843395156951
    }).hint([('_id', 1)]).explain()

据我了解，由于 _id 是一个复合字段，而 Mongo 总是在 _id 上维护一个索引，因此要回答上述查询，Mongo 应该使用 '_id' 上的索引。但是，上述查询的答案如下：

{u'allPlans': [{u'cursor': u'BtreeCursor _id_',
   u'indexBounds': {u'_id': [[{u'$minElement': 1}, {u'$maxElement': 1}]]},
   u'n': 2803,
   u'nscanned': 4869528,
   u'nscannedObjects': 4869528}],
 u'cursor': u'BtreeCursor _id_',
 u'indexBounds': {u'_id': [[{u'$minElement': 1}, {u'$maxElement': 1}]]},
 u'indexOnly': False,
 u'isMultiKey': False,
 u'millis': 128415,
 u'n': 2803,
 u'nChunkSkips': 0,
 u'nYields': 132,
 u'nscanned': 4869528,
 u'nscannedAllPlans': 4869528,
 u'nscannedObjects': 4869528,
 u'nscannedObjectsAllPlans': 4869528,
 u'scanAndOrder': False,

可以观察到，MongoDB 正在对 DB 进行一次完整的扫描，以查找少量文档。我不知道这里到底出了什么问题。

我尝试更改查询顺序，但结果相同。我不知道这里发生了什么。如果深表感谢，请提供任何帮助。

更新

我理解这里的细微差别。_id 不是复合索引，它只是一个精确的索引。这意味着如果 _id 是一个文档，那么无论文档的结构以及它可能有多少嵌套的 attrs 或子文档，_id 索引将只包含 _id 字段的一个条目。该条目假定为 _id 文档的哈希，并将保持唯一。

score 6 · Accepted Answer

您正在使用对象作为键，但这里没有使用复合索引。

_id索引有点特殊，因为它是自动创建的，并且始终是唯一的。通常，_id索引是一个ObjectId、 aUUID或者可能是integer一个包含某种散列的字符串。MongoDB 支持复杂对象作为键。但是，对于 MongoDB，这仍然只是一个文档。它可以与其他文档进行比较，具有相同字段和值的文档将是相等的。但是由于您没有创建索引键（并且您不能手动创建该索引），MongoDB 不知道它包含一个 field#和一个 field ts。

另一方面，复合索引明确地引用文档的字段，例如{"product.quantity" : 1, "product.created" : -1}。这必须在创建索引时指定。

看来您基本上是在尝试在主键中存储时间戳。MongoDBObjectId已经包含一个时间戳，因此您可以ObjectIds直接进行基于日期的范围查询。

mongodb - MongoDB 未在“_id”上使用复合索引

1 回答 1

Related

Reference