2

以下是三个连续查询及其基准性能:

ids = @Company.projects.submitted.uniq.collect(&:person_id)
  1.370000   0.060000   1.430000 (  3.763946)

@persons = Person.where("id IN (?)", ids)
  0.030000   0.000000   0.030000 (  0.332878)

@emails = @persons.collect(&:email).reject(&:blank?)
  16.550000  1.640000  18.190000  (128.002465)

ids包含近 10000 个 ID,在运行我看到的最后一个查询时:

SELECT "persons".* FROM "persons" WHERE (id in (121,142,173,178...14202))
(*1000s ->) User Load (13.0ms)  SELECT "users".* FROM "users" WHERE "users"."roleable_type" = 'Person' AND "users"."roleable_id" = 121 LIMIT 1

Indexes on User:
add_index "users", ["roleable_id", "roleable_type"], :name => "index_users_on_roleable_id_and_roleable_type"
add_index "users", ["roleable_type", "roleable_id"], :name => "index_users_on_roleable_type_and_roleable_id"

我该如何解决这里发生的事情?

4

1 回答 1

1

您拥有的第二个查询实际上并没有命中数据库。它正在构建一个ActiveRecord::Relation(惰性查询),在调用第三个查询之前不会触发。您可以通过添加.all到第二个查询的末尾来证明这一点。

要解决性能问题,您希望使用文字列表摆脱IN (),因为这确实会损害大型列表的数据库性能:

@persons = Person.joins(:projects).merge(@Company.projects.submitted)

您也可以使用子查询来执行此操作(尽管效率低于 JOIN):

subquery = @Company.projects.submitted.select("projects.person_id").to_sql
@persons = Person.where("id IN (#{subquery})")

如果您只想获得结果@emails,并且并不真正需要@persons集合,您可以像这样稍微提高效率:

@email = Person.joins(:projects).merge(@Company.projects.submitted).
                  where("LENGTH(persons.email) > 0").pluck(:email)
于 2013-05-01T18:41:54.977 回答