我一直在寻找 Rails 的插件/宝石。大多数文章将 Ferret (Lucene) 与 Ultrasphinx 或可能的 Thinking Sphinx 进行了比较,但没有一篇文章提到SearchLogic。有没有人知道这个比较如何?你用什么,它的表现如何?
8 回答
thinking_sphinx 和 sphinx 工作得很好,没有索引、查询、安装问题(5 或 6 次安装,包括生产 slicehost)
为什么不是每个人都使用狮身人面像,比如craigslist?在这里阅读它的局限性(一年半以前的文章。狮身人面像开发人员 Aksyonoff 正在研究这些,他正在以惊人的速度增加功能和可靠性并消除错误)
http://codemonkey.ravelry.com/2008/01/09/sphinx-for-search/
http://www.ibm.com/developerworks/opensource/library/os-php-apachesolr/
全文搜索引擎对比——Lucene、Sphinx、Postgresql、MySQL?
ferret:易于安装,不正确,索引非常慢(一个 mysql db:sphinx:3 秒,ferret:50 分钟)。负载下生产中的 drb 服务器中记录良好的问题(索引损坏)。话虽如此,自从acts-as_ferret 3 年前问世以来,我一直在develometn 中使用它,它对我很有帮助。在某些情况下,不遵守搬运工词干是一个优势。
Lucene 和 Solr 是开源搜索的大猩猩/麦克卡车/重量级冠军。团队在solr 14 版本中做了很多令人印象深刻的新功能:
充当solr:一旦tomcat或码头就位,效果很好,但有时会很痛苦。mattmatt的AAS 分叉是主要的分叉,但该项目相对无人维护。
重新安装 tomcat:SOLR/lucene 无疑拥有我见过的任何软件包中最好的知识库/支持搜索引擎(我想我并不感到惊讶),这里的搜索框:
http://www.lucidimagination.com/
Sunspot 新的ruby 包装器,建立在 solr-ruby 之上。看起来很有希望,但我无法在 OSX 上安装它。通过 AR 索引所有 ruby 对象,而不仅仅是数据库
真正具有指导意义的一件事是安装 2 个搜索插件,例如 sphinx 和 SOLR、sphinx 和 ferret,并查看它们返回的不同结果。这很容易
@sphinx_results - @ferret_results
刚看到这个帖子和回复
http://www.jroller.com/otis/entry/open_source_search_engine_benchmark
首先,我明显的偏见:我创建并维护了 Thinking Sphinx。
碰巧的是,我实际上在昨晚的纽约红宝石会议上看到了 Ben Johnson(SearchLogic 的创建者)。SearchLogic 仅支持 SQL - 因此,如果您不处理大量表,并且不需要相关性排名,那么它可能正是您正在寻找的。语法也很干净。
但是,如果您希望由不是您自己的代码处理所有查询智能,那么 Sphinx 或 Solr(我认为它是 Lucene 的底层)可能会更好。
SearchLogic 是一个很好的插件,但实际上是为了让您的搜索代码更具可读性,它不提供 Sphinx 所做的自动索引。我没有用过雪貂,但狮身人面像非常强大。
http://railscasts.com/episodes/120-thinking-sphinx
很好的介绍,看看它有多灵活。
我没有使用过 SearchLogic,但我可以告诉你 Lucene 是一个非常成熟的项目,它有多种语言的实现。它快速灵活,API 使用起来很有趣。这是一个不错的选择。
鉴于这个问题在 google 的全文搜索中仍然排名很高,我真的想说,如果您有兴趣在 Rails 应用程序中添加全文搜索功能(并且希望 Solr 支持) , Sunspot今天会更加强大你为此)。你可以在这里查看完整的教程。
当我们在做的时候,另一个已经进入该领域的竞争者是ElasticSearch,它的目标是成为一个构建在 Lucene 之上的实时全文搜索引擎(但与 Solr 相比做事不同)。ElasticSearch 包括开箱即用的分片和复制到多个节点、更快的实时搜索、“过滤器”,允许您在符合您的条件的内容可用时接收通知,并且它的移动速度非常快,还有更多其他功能。在它之上构建一些东西很容易,因为 API 非常简单并且完全基于使用 JSON 作为格式的 REST。有人可以说你甚至不需要插件来使用它。
就个人而言,我不为 Web 应用程序的数据库无关而烦恼,并且很高兴使用 pg83 中的全文搜索。好处是,如果当您更改框架/语言时,您仍然可以进行全文搜索。
对于任何寻找没有任何依赖关系的简单搜索 gem 的人,请查看acts_as_indexed
全文索引和MATCH() AGAINST()
.
如果您只是想对表中的几个文本列进行快速搜索,您可以简单地使用这些列的全文索引并MATCH() AGAINST()
在查询中使用。
在迁移文件中创建全文索引:
add_index :table, :column, type: :fulltext
使用该索引查询:
where( "MATCH( column ) AGAINST( ? )", term )
ElasticSearch和Searchkick
如果您正在寻找一个完整的搜索索引解决方案,它允许您搜索任何记录中的任何列,同时仍然快速,请查看ElasticSearch和Searchkick。
ElasticSearch是索引和搜索引擎。
Searchkick是与 Rails 的集成库,可以很容易地为您的记录建立索引并进行搜索。
Searchkick 的自述文件在解释如何启动和运行以及微调您的设置方面做得非常出色,但这里有一个小片段:
安装并启动 ElasticSearch。
brew install elasticsearch brew services start elasticsearch
将
searchkick
gem 添加到您的捆绑包中:bundle add searchkick --strict
该
--strict
选项只是告诉 Bundler 在您的 Gemfile 中使用精确的版本,我强烈推荐。添加
searchkick
到要索引的模型:class MyModel < ApplicationRecord searchkick end
索引您的记录。
MyModel.reindex
搜索您的索引。
matching_records = MyModel.search( "term" )