28

我正在使用 ElasticSearch 和 Tire 来索引和搜索一些 ActiveRecord 模型,并且我一直在寻找索引和搜索关联的“正确”方式。我还没有找到似乎是最佳实践的方法,所以我想问问是否有人有他们认为非常有效的方法。

作为示例设置(这是编造的,但说明了问题),假设我们有一本书,有章节。每本书都有一个标题和作者,以及一堆章节。每章都有文字。我们希望为图书的字段和章节文本编制索引,以便您可以按作者搜索图书,或搜索其中包含特定单词的任何图书。

class Book < ActiveRecord::Base
  include Tire::Model::Search
  include Tire::Model::Callbacks

  has_many :chapters

  mapping do
    indexes :title, :analyzer => 'snowball', :boost => 100
    indexes :author, :analyzer => 'snowball'
    indexes :chapters, type: 'object', properties: {
      chapter_text: { type: 'string', analyzer: 'snowball' }
    }
  end
end

class Chapter < ActiveRecord::Base
  belongs_to :book
end

因此,我使用以下方法进行搜索:

s = Book.search do
  query { string query_string }
end

这不起作用,即使看起来索引应该这样做。相反,如果我索引:

indexes :chapters, :as => 'chapters.map{|c| c.chapter_text}.join('|'), :analyzer => 'snowball'

这使得文本可搜索,但显然它不是一个很好的 hack,它会丢失实际的关联对象。我尝试了搜索的变体,例如:

s = Book.search do
  query do
    boolean do
      should { string query_string }
      should { string "chapters.chapter_text:#{query_string}" }
    end
  end
end

那里也没有运气。如果有人有一个使用 Tire 索引和搜索关联 ActiveRecord 对象的良好、清晰的示例,那么这似乎是对这里知识库的一个非常好的补充。

感谢您的任何想法和贡献。

4

2 回答 2

52

Tire 中对 ActiveRecord 关联的支持正在运行,但需要在您的应用程序中进行一些调整。毫无疑问,图书馆应该在这里做得更好,而且将来肯定会做得更好。

也就是说,这是一个完整的轮胎配置示例,可与 Rails 在 elasticsearch 中的关联一起使用:active_record_associations.rb

让我在这里强调几件事。

抚摸父母

首先,您必须确保将关联的更改通知关联的父模型。

鉴于我们有一个Chapter“属于” a 的模型Book,我们需要这样做:

class Chapter < ActiveRecord::Base
  belongs_to :book, touch: true
end

这样,当我们做类似的事情时:

book.chapters.create text: "Lorem ipsum...."

book实例会收到有关添加章节的通知。

响应触摸

对这部分进行排序后,我们需要将更改通知Tyre,并相应地更新 elasticsearch 索引:

class Book < ActiveRecord::Base
  has_many :chapters
  after_touch() { tire.update_index }
end

(毫无疑问, Tire应该自行拦截after_touch通知,而不是强迫您这样做。另一方面,这证明了以不伤害您的眼睛的方式绕过库限制是多么容易.)

Rails < 3.1 中正确的 JSON 序列化

尽管 README 提到您必须在 Rails < 3.1 中禁用自动“在 JSON 中添加根密钥”,但许多人忘记了它,因此您还必须将其包含在类定义中:

self.include_root_in_json = false

弹性搜索的正确映射

现在是我们工作的重点——为我们的文档(模型)定义正确的映射:

mapping do
  indexes :title,      type: 'string', boost: 10, analyzer: 'snowball'
  indexes :created_at, type: 'date'

  indexes :chapters do
    indexes :text, analyzer: 'snowball'
  end
end

请注意,我们使用 boosting 索引titlecreated_at作为“日期”,以及来自关联模型的章节文本。在 elasticsearch 中,所有数据都被有效地“反规范化”为单个文档(如果这样的术语有点意义的话)。

正确的文档 JSON 序列化

作为最后一步,我们必须正确序列化 elasticsearch 索引中的文档。请注意我们如何利用ActiveRecordto_json中的便捷方法:

def to_indexed_json
  to_json( include: { chapters: { only: [:text] } } )
end

完成所有这些设置后,我们可以在文档的 theBookChapterpart 中搜索属性。

请运行开头链接的active_record_associations.rb Ruby 文件以查看全貌。

如需更多信息,请参阅以下资源:

请参阅此 StackOverflow 答案:ElasticSearch 和轮胎:使用映射和 to_indexed_json了解有关mapping/to_indexed_json相互作用的更多信息。

请参阅此 StackOverflow 答案:Index the results of a method in ElasticSearch (Tire + ActiveRecord)以了解在为具有关联的模型编制索引时如何应对 n+1 个查询。

于 2012-07-29T17:42:13.160 回答
3

我在我的一个应用程序中创建了这个作为解决方案,它索引了一组深度嵌套的模型

https://gist.github.com/paulnsorensen/4744475

更新:我现在发布了一个可以执行此操作的 gem: https ://github.com/paulnsorensen/lifesaver

于 2013-02-09T07:26:51.720 回答