16

在我们的 Rails 应用程序中,我们需要根据请求的子域(每个国家/地区不同的数据库)使用不同的数据库。

现在我们正在做一些类似于这个问题中推荐的事情。也就是说,调用ActiveRecord::Base.establish_connection每个请求。

它似乎 ActiveRecord::Base.establish_connection会丢弃当前的连接池并在每次调用时建立一个新的连接。

establish_connection我做了这个快速基准测试,看看每次调用和已经建立连接之间是否有任何显着差异:

require 'benchmark/ips'

$config = Rails.configuration.database_configuration[Rails.env]
$db1_config = $config.dup.update('database' => 'db1')
$db2_config = $config.dup.update('database' => 'db2')

# Method 1: call establish_connection on each "request".
Benchmark.ips do |r|
  r.report('establish_connection:') do
    # Simulate two requests, one for each DB.
    ActiveRecord::Base.establish_connection($db1_config)
    MyModel.count # A little query to force the DB connection to establish.
    ActiveRecord::Base.establish_connection($db2_config)
    MyModel.count
  end
end

# Method 2: Have different subclasses of my models, one for each DB, and 
# call establish_connection only once
class MyModelDb1 < MyModel
  establish_connection($db1_config)
end

class MyModelDb2 < MyModel
  establish_connection($db2_config)
end

Benchmark.ips do |r|
  r.report('different models:') do
    MyModelDb1.count
    MyModelDb2.count
  end
end

我运行这个脚本rails runner并指向一个本地mysql,在数据库上有几千条记录,结果似乎表明这两种方法之间实际上存在很大的差异(一个数量级)(顺便说一句,我'我不确定基准是否有效或我搞砸了,因此结果具有误导性):

Calculating -------------------------------------
establish_connection: 8 i/100ms
-------------------------------------------------
establish_connection: 117.9 (±26.3%) i/s -        544 in   5.001575s
Calculating -------------------------------------
    different models:  119 i/100ms
-------------------------------------------------
    different models:  1299.4 (±22.1%) i/s -       6188 in   5.039483s

所以,基本上,我想知道是否有办法为每个子域维护一个连接池,然后重新使用这些连接,而不是在每个请求上建立一个新连接。为每个子域拥有我的模型的子类是不可行的,因为有很多模型;我只想更改所有模型的连接(在ActiveRecord::Base

4

2 回答 2

12

好吧,我一直在深入研究这一点,并设法得到一些工作。

在阅读了tenderlove关于ActiveRecord中连接管理的帖子后,它解释了类层次结构如何与连接管理不必要地耦合,我明白为什么我想做的事情不像人们期望的那样简单。

我最终做的是继承 ActiveRecord 的ConnectionHandler并在我的模型层次结构的顶部使用新的连接处理程序(需要对 ConnectionHandler代码进行一些摆弄以了解它在内部是如何工作的;所以当然这个解决方案可能与 Rails 非常相关我正在使用的版本(3.2))。就像是:

# A model class that connects to a different DB depending on the subdomain 
# we're in
class ModelBase < ActiveRecord::Base
  self.abstract_class = true
  self.connection_handler = CustomConnectionHandler.new
end

# ...

class CustomConnectionHandler < ActiveRecord::ConnectionAdapters::ConnectionHandler
  def initialize
    super
    @pools_by_subdomain = {}
  end

  # Override the behaviour of ActiveRecord's ConnectionHandler to return a
  # connection pool for the current domain.
  def retrieve_connection_pool(klass)
    # Get current subdomain somehow (Maybe store it in a class variable on 
    # each request or whatever)
    subdomain = @@subdomain
    @pools_by_subdomain[subdomain] ||= create_pool(subdomain)
  end

  private
  def create_pool(subdomain)
    conf = Rails.configuration.database_configuration[Rails.env].dup
    # The name of the DB for that subdomain...
    conf.update!('database' => "db_#{subdomain}")
    resolver = ActiveRecord::Base::ConnectionSpecification::Resolver.new(conf, nil)
    # Call ConnectionHandler#establish_connection, which receives a key 
    # (in this case the subdomain) for the new connection pool
    establish_connection(subdomain, resolver.spec)
  end
end

这仍然需要一些测试来检查是否确实有性能提升,但我在本地 Unicorn 服务器上运行的初始测试表明确实有。

于 2013-05-27T21:05:53.997 回答
0

据我所知,Rails 不会在请求之间维护它的数据库池,除非您使用多线程环境。像 Sidekiq。但是如果您在生产服务器上使用Passenger 或Unicorn,它将为每个Rails 实例创建一个新的数据库连接。

所以基本上使用数据库连接池是没有用的,这意味着在每个请求上创建一个新的数据库连接不应该是一个问题。

于 2013-05-27T20:03:10.323 回答