11

我正在努力实现以下目标:

选择我拥有的所有记录,其中所有权是我创建的对象或我管理的用户创建的对象,其中用户管理可以在管理用户的用户层次结构中

所有权显然是直截了当的,可以通过与所有者相对应的简单 id 来处理。用户管理的层次结构让我有点难以执行,而无需通过大量 ID 列表进行繁重的工作(您显然可以找到每个受管理的用户并列出由任何这些用户使用 IN 子句或类似语句创建的每个对象)。

理想情况下,这一切都发生在一个查询中,因此可以发生正常的分页和条件。

我在想可能有一些数学来完成它 - 拥有可以以某种方式散列以确定它们是否由命令链中的任何人拥有的 ID。

这种事情有什么参考资料吗?

我错过了一些明显的东西吗?

如果这会有所作为,请使用 MongoDB,但很高兴考虑其他数据库以获得灵感。

更新: 创建了一个包含 1,000,000 条记录的 MongoDB 集合,以获取一些可靠的数据,这些数据准确地说明了查询中 IN 子句的可管理数量的参数。当我有一些具体信息时会报告。

分析:

使用 ruby​​-mongo-driver 和 ruby​​ 基准库。

具有 1039944 条记录的 MongoDB 集合

记录定义为:

{
    first_name: String,
    last_name: String,
    email: String,
    phone: String,
    company: String,
    owner: BSON::ObjectId
 }

为所有字段随机生成值。

Owner 字段有一个索引。

在以下条件下运行查询:

conditions = {"owner" => { "$in" => id_list }}
opts = {skip: rand, limit: 100}

结果:

    # 10201 ids
    #              user     system      total        real
    # 0:       0.240000   0.000000   0.240000 (  0.265148)
    # 1:       0.240000   0.010000   0.250000 (  0.265757)
    # 2:       0.240000   0.000000   0.240000 (  0.267149)
    # 3:       0.240000   0.000000   0.240000 (  0.269981)
    # 4:       0.240000   0.000000   0.240000 (  0.270436)
    # Find:    0.240000   0.000000   0.240000 (  0.266709)


    # 5201 ids
    #              user     system      total        real
    # 0:       0.120000   0.000000   0.120000 (  0.133824)
    # 1:       0.120000   0.000000   0.120000 (  0.134787)
    # 2:       0.110000   0.000000   0.110000 (  0.133262)
    # 3:       0.110000   0.000000   0.110000 (  0.136046)
    # 4:       0.120000   0.000000   0.120000 (  0.141220)
    # Find:    0.130000   0.000000   0.130000 (  0.139110)

    # 201 ids
    #              user     system      total        real
    # 0:       0.010000   0.000000   0.010000 (  0.006044)
    # 1:       0.000000   0.000000   0.000000 (  0.004681)
    # 2:       0.010000   0.000000   0.010000 (  0.004578)
    # 3:       0.000000   0.000000   0.000000 (  0.007048)
    # 4:       0.010000   0.000000   0.010000 (  0.008487)
    # Find:    0.000000   0.000000   0.000000 (  0.005990)

    # 1 id (NOT using IN)
    #              user     system      total        real
    # 0:       0.000000   0.000000   0.000000 (  0.002868)
    # 1:       0.000000   0.000000   0.000000 (  0.004937)
    # 2:       0.010000   0.000000   0.010000 (  0.003151)
    # 3:       0.000000   0.000000   0.000000 (  0.002983)
    # 4:       0.000000   0.000000   0.000000 (  0.003313)
    # Find:    0.000000   0.000000   0.000000 (  0.002742)

即使查询中有 10k 个 id 的列表,性能也相当出色。

4

1 回答 1

2

如果您尝试根据“列”从 MongoDB 中“选择”记录,该“列”具有一组可能的值,您需要与用户管理表进行连接才能确定,那么 NoSQL 对您不利……

如果用户 ID 列表仍然可以管理,您可以进行一种where ownerId in (?,?,?,?,?...)查询(在首先确定列表之后):

db.documents.find({owner:{$in: [1234, 2345, 4444, 77777, 99999]}})

NoSQL 方法可能是对事物进行非规范化,例如不仅在文档中包含 ownerId,还包括管理层次结构的完整路径:

{  _id: 'the document A',
   owner : 1234,
   managers: [ 2345, 4444, 77777, 99999 ]
}

当然,当用户层次结构发生变化时,这将需要更新。

于 2011-11-21T05:31:04.633 回答