3

在 mongoDB 中使用大型集合时,对文档样本而不是整个集合进行分析通常很有帮助。一种干净的方法是通过将 ObjectId 映射到整数上的哈希函数运行 ObjectId,然后使用 $mod 选择文档的子样本。

要点是以一种有效随机的方式抽取文档样本:选择到集合中与我们可能关心的任何其他内容无关。

有没有好的方法来做到这一点?如果查询很快,则加分。

PS:我知道随机属性的方法,但不太喜欢它,因为它浪费存储空间。

4

1 回答 1

0

难道你不能在一个数组中获取集合中文档的所有 objectId,对数组进行排序,然后在该数组中选择随机索引位置吗?

于 2013-02-11T19:48:40.070 回答