11

我正在使用 Tire 和 ActiveRecord 为弹性搜索的数据集建立索引。我有一个 Artist 模型,它有_many :images。如何索引返回特定图像的 Artist 模型的方法?或者引用关联模型的方法?我想要的艺术家结果将包括与艺术家关联的主要图像的路径(原始图像和缩略图)。

我试过这个映射:

mapping do
  indexes :id,                  :index    => :not_analyzed
  indexes :name                     
  indexes :url
  indexes :primary_image_original       
  indexes :primary_image_thumbnail
end

引用这些 Artist 方法:

    def primary_image_original  
        return images.where(:priority => 'primary').first.original
    end

    def primary_image_thumbnail
        return images.where(:priority => 'primary').first.thumbnail_150
    end

这只是忽略了索引方法。基于Elasticsearch、Tire 和 Nested queries/associations with ActiveRecord等其他答案,我尝试了这个:

mapping do
  indexes :id,                  :index    => :not_analyzed
  indexes :name 
  indexes :url
  indexes :images do
    indexes :original
    indexes :thumbnail_150
    indexes :priority
  end
end

def to_indexed_json
    to_json(include: { images: { only: [:original, :thumbnail_150, :priority] } } )
end

但这也不会返回我所追求的。我花了几个小时在谷歌上搜索并阅读了 elasticsearch 和 Tire 文档,但还没有找到可以遵循的这种模式的工作示例。谢谢你的想法!

4

1 回答 1

6

因此,在此处包含您对索引问题的解决方案。

索引关联

索引方法的一种方法是将其包含在to_json调用中:

def to_indexed_json
  to_json( 
    :only   => [ :id, :name, :normalized_name, :url ],
    :methods   => [ :primary_image_original, :primary_image_thumbnail, :account_balance ]
  )
end

另一种,更可取的是,使用:as映射块中的选项:

mapping do
  indexes :id, :index    => :not_analyzed
  indexes :name             
  # ...

  # Relationships
  indexes :primary_image_original, :as => 'primary_image_original'
  indexes :account_balance,        :as => 'account_balance'
end

导入时对抗n+1 个查询

索引速度慢的问题很可能是由于数据库中的n+1 个查询:对于您索引的每个艺术家,您都会发出一个图像查询(原始和缩略图)。一种更高效的方法是在一个查询中加入关联的记录;请参阅Rails 指南中的Eager Loading Associations

TireIndex#import方法和 import Rake 任务允许您传递参数,然后将这些参数沿线路发送到 paginate 方法。

所以让我们比较一下幼稚的方法:

bundle exec rake environment tire:import CLASS=Article FORCE=true
Article Load (7.6ms)  SELECT "articles".* FROM "articles" LIMIT 1000 OFFSET 0
Comment Load (0.2ms)  SELECT "comments".* FROM "comments" WHERE ("comments".article_id = 1)
Comment Load (0.1ms)  SELECT "comments".* FROM "comments" WHERE ("comments".article_id = 2)
...
Comment Load (0.3ms)  SELECT "comments".* FROM "comments" WHERE ("comments".article_id = 100)

当我们传递include片段时:

bundle exec rake environment tire:import PARAMS='{:include => ["comments"]}'  CLASS=Article FORCE=true 
Article Load (8.7ms)  SELECT "articles".* FROM "articles" LIMIT 1000 OFFSET 0
Comment Load (31.5ms) SELECT "comments".* FROM "comments" WHERE ("comments".article_id IN (1,2, ... ,100))

好多了:) 请尝试一下,如果它解决了您的问题,请告诉我。


您也可以在 Rails 控制台中尝试一下:Article.importvs Article.import(include: ['comments']). . 附带说明一下,这个确切的问题是在Tireparams的整个导入工具链中支持哈希的原因。

于 2012-12-12T20:20:15.403 回答