我们最近为我们的一个主要系列创造了超过 200 万的记录,现在我们开始为该系列的主要性能问题而受苦。
集合中的文档有大约 8 个字段,您可以使用 UI 过滤这些字段,并且结果应该按处理记录的时间戳字段排序。
我添加了几个带有过滤字段和时间戳的复合索引,例如:
db.events.ensureIndex({somefield: 1, timestamp:-1})
我还添加了几个索引,以便一次使用多个过滤器,以期获得更好的性能。但是一些过滤器仍然需要很长时间才能执行。
我已经确保使用解释查询确实使用了我创建的索引,但性能仍然不够好。
我想知道分片是否是现在要走的路..但我们很快就会开始在该集合中每天有大约 100 万条新记录..所以我不确定它是否会很好地扩展..
编辑:查询示例:
> db.audit.find({'userAgent.deviceType': 'MOBILE', 'user.userName': {$in: ['nickey@acme.com']}}).sort({timestamp: -1}).limit(25).explain()
{
"cursor" : "BtreeCursor user.userName_1_timestamp_-1",
"isMultiKey" : false,
"n" : 0,
"nscannedObjects" : 30060,
"nscanned" : 30060,
"nscannedObjectsAllPlans" : 120241,
"nscannedAllPlans" : 120241,
"scanAndOrder" : false,
"indexOnly" : false,
"nYields" : 1,
"nChunkSkips" : 0,
"millis" : 26495,
"indexBounds" : {
"user.userName" : [
[
"nickey@acme.com",
"nickey@acme.com"
]
],
"timestamp" : [
[
{
"$maxElement" : 1
},
{
"$minElement" : 1
}
]
]
},
"server" : "yarin:27017"
}
请注意 deviceType 在我的收藏中只有 2 个值。