2
@integration = Integration.first(:conditions=> {:integration_name => params[:integration_name]}, :joins => :broker, :select => ['`integrations`.*, `brokers`.*'])
$stderr.puts @integration.broker.id # This line causes Brokers to be queried again

结果是:

Integration Load (0.4ms)   SELECT `integrations`.*, `brokers`.* FROM `integrations` INNER JOIN `brokers` ON `brokers`.id = `integrations`.broker_id WHERE (`integrations`.`integration_name` = 'chicke') LIMIT 1
Integration Columns (1.5ms)   SHOW FIELDS FROM `integrations`
Broker Columns (1.6ms)   SHOW FIELDS FROM `brokers`
Broker Load (0.3ms)   SELECT * FROM `brokers` WHERE (`brokers`.`id` = 1) 

任何想法为什么 Rails 会再次访问数据库,brokers即使我已经加入/选择了它们?

以下是模型(代理 -> 集成是一对多的关系)。请注意,这是不完整的,我只包括了建立它们关系的行

class Broker < ActiveRecord::Base

  # ActiveRecord Associations
  has_many :integrations

class Integration < ActiveRecord::Base

  belongs_to :broker

我使用的是 Rails/ActiveRecord 2.3.14,所以请记住这一点。

当我这样做时Integration.first(:conditions=> {:integration_name => params[:integration_name]}, :include => :broker),那条线会导致两个SELECTs

Integration Load (0.6ms)   SELECT * FROM `integrations` WHERE (`integrations`.`integration_name` = 'chicke') LIMIT 1
  Integration Columns (2.4ms)   SHOW FIELDS FROM `integrations`
  Broker Columns (1.9ms)   SHOW FIELDS FROM `brokers`
  Broker Load (0.3ms)   SELECT * FROM `brokers` WHERE (`brokers`.`id` = 1) 
4

2 回答 2

8

使用include而不是joins避免重新加载Broker对象。

Integration.first(:conditions=>{:integration_name => params[:integration_name]}, 
  :include => :broker)

无需给出该select子句,因为您没有尝试规范化brokers表列。

注1:

在预先加载依赖项时,AR 对每个依赖项执行一个 SQL。在您的情况下,AR 将执行 main sql + brokersql。由于您试图获得一排,因此没有太多收获。当您尝试访问 N 行时,如果您急切加载依赖项,您将避免 N+1 问题。

笔记2:

在某些情况下,使用自定义急切加载策略可能会有所帮助。让我们假设您只想获取集成的关联代理名称。您可以按如下方式优化您的 sql:

integration = Integration.first(
  :select => "integrations.*, brokers.name broker_name",
  :conditions=>{:integration_name => params[:integration_name]}, 
  :joins => :broker)

integration.broker_name # prints the broker name

查询返回的对象将包含select子句中的所有别名列。

Integration当您想要返回对象时,即使没有相应的对象,上述解决方案也不起作用Broker。你必须使用OUTER JOIN.

integration = Integration.first(
  :select => "integrations.*, brokers.name broker_name",
  :conditions=>{:integration_name => params[:integration_name]}, 
  :joins => "LEFT OUTER JOIN brokers ON brokers.integration_id = integrations.id")
于 2012-06-22T01:40:24.003 回答
2

这些:joins选项只是使活动记录向查询添加连接子句。它实际上并没有使活动记录对返回的行做任何事情。关联未加载,因此访问它会触发查询

:include选项是关于提前加载关联的。活动记录有两种策略来做到这一点。一种是通过大连接查询,另一种是通过每个关联触发一个查询。默认为后者,这就是您看到两个查询的原因。

Integration.preload(:broker)在 rails 3.x 上,您可以通过或来决定您想要哪些策略Integration.eager_graph(:broker)

rails 2.x 中没有这样的工具,所以您唯一能做的就是欺骗用于确定策略的启发式方法。每当 rails 认为 order 子句、select 子句或条件引用了包含关联上的列时,它就会切换到 joins 策略(因为它是唯一在这种情况下有效的策略)。

例如做类似的事情

Integration.first(:conditions => {...}, :include => :broker, :select => 'brokers.id as ignored')

应该强制使用替代策略(在这种情况下,活动记录实际上忽略了选择选项)。

于 2012-06-24T20:21:46.817 回答