3

我正在用 ASP.NET 4.5 C# 构建一个 Web 应用程序。我的应用将严重依赖搜索功能。我正在为我的项目寻找一个高性能的搜索解决方案。我正在寻找一种高效/快速且易于实施的方法。

在浏览了一些解决方案后,我发现 ElasticSearch 提供了出色的搜索功能,如果我决定在那里部署我的项目,它也得到了 Amazon Web Services 的支持。

但是,我读到 MySQL 5.6 现在具有 InnoDB 表的全文搜索功能。我想知道每种方法的区别、优缺点,以便决定在我的下一个项目中使用哪种方法。

我的主要目标:能够对我的数据库进行非常快速的搜索,并享受自然语言搜索、评分等带来的好处。实际上,我的可搜索文本字段将具有 100 个字符的非常小的文本字段。

我的问题总结:

  1. MySQL 5.6 全文搜索和 ElasticSearch 之间的根本区别是什么?(的优点和缺点)
  2. 使用 MySQL 全文搜索,我是否需要将搜索索引/功能与数据库分开(例如,使用 ElasticSearch,我正在使用可以部署在不同服务器上的 ELasticSearch 服务器。我想知道这是否与 MySQL Full 相同?文本搜索也是?
  3. 哪一个更容易实现?
  4. 在 ASP.NET 项目中使用其中任何一个是否有任何优势(如支持的客户端库等)

谢谢。

4

1 回答 1

13

我对 MySQL 5.6 全文搜索功能不是很熟悉,但我在我的 ASP.NET Web 应用程序中使用了 ElasticSearch。

  1. MySQL 用 SQL 查询,ES 用 JSON 查询,因为它是 RESTful

  2. MySQL 本身就是数据库管理系统,而 ElasticSearch 只是一个搜索引擎。执行搜索的数据存储在它的索引中(ElasticSearch 数据存储称为索引)。该索引有时会失败,然后您需要将数据备份到某个外部数据库中(我使用的是 NoSQL 解决方案 - MongoDB,因为我遇到了 BigData 问题),然后从中恢复它。

  3. ElasticSearch 是分布式系统。它使用分片 - 当您执行搜索时,索引被分成多个分片,这些分片由单独的线程独立搜索。然后将搜索结果合并为一组。由于评分是根据执行搜索的记录数以某种方式计算的,因此同一记录的评分可能会有所不同,具体取决于它是哪个分片以及分配给该分片的记录数(尽管它可以在搜索查询选项中配置) - 见 DFSThenFetch)

  4. ES 可以通过使用 NEST 库从 C# 代码进行交互,它允许您将 ES 实体映射到 C# 类并通过 LINQ 查询它们,通过 lambda 语法(使用表达式而不是谓词)

  5. 如果您的实体有很多字段,那么查询 ElasticSearch 可能会非常具有挑战性。就我而言,我必须实现一个非常复杂的查询构建器,因为有很多方法可以在 ElasticSearch 上执行搜索查询 - 请参阅http://www.elasticsearch.org/guide/reference/query-dsl/(所有这些查询类型在 NEST 库中实现)。您对匹配字符串的查询与过滤数据完全不同,例如。大于或小于等于。

  6. ES 允许您使用基于 Levenshtein 距离的模糊匹配,这在处理拼写错误时非常好。

  7. ElasticSearch 非常非常快。MS SQL Server 搜索我的数据(通过简单查询)超过 1 分钟,而 ES 在不到 20 毫秒的时间内完成(即使使用非常复杂的查询)。它是Lucene搜索引擎的分布式实现。

我知道我的帖子并不能直接回答您的问题,但我希望它能为您提供一些有关 ElasticSearch 的信息,并以任何方式帮助您。干杯。

于 2013-08-15T09:27:33.360 回答