0

前言:

这个问题并不是要求对 Elastic Search 与 Solr 与 Datastax Solr (Datastax EE) 进行开放式比较。(尽管欢迎评论部分中的链接)。

项目:

我一直在构建域名类型的 Web 服务。在这样做的过程中,我意识到这种服务的指数级增长。

背景:

我想知道哪个特定的搜索平台可以让我无限地保存和扩展。是的,我意识到这些天你可以拆分一个 Solr Shard——所以如果我有一个 20 个 shard 的 solr 云,我以后可以将它们拆分成 40 个(我认为?再次......这不是不确定的)。不确定在弹性搜索方面。由于 Cassandra 的架构,Datastax (EE) 似乎是答案,但是 (A) 因为他们没有提供许可证价格的透明度——我必须披露我的收入对他们来说,我很快就想起了甲骨文的“让你慢慢流血”的策略,在我刚起步时,这是一个巨大的威慑。另外,(B) 当他们说他们将完整的 MapReduce 与 Hive、Sqop、Mahout、Solr 和 Pig 集成在一起时——我想我不想花一生的时间来学习那些不适用于我的项目的花里胡哨。我想要一个搜索平台,我可以在一个月内无限期地添加 20 亿个文档(或任何数量),而不必担心我启动的集群前期分片太少。

问题:

诚然,我的背景部分被盗用了我想纠正的无知。我的目的不是冒犯或淡化这些惊人的技术。我只是想知道它们中的哪些可以扩展而不必担心碎片过度增长[我在这里永远删除了这个词——谢谢你在下面的评论]。或者可以吗?不是硬件方面的,而是碎片。我可以使用哪个平台,而不必担心未来的增长是 20TB 还是 2PB。假设服务器、交换机等的硬件预算是不确定的。

4

2 回答 2

1

DataStax Enterprise (DSE) 本身并不是一个“搜索平台”。DSE 提供的功能之一是能够搜索存储在 Cassandra 中的数据。Cassandra 被用于存储和访问企业运营数据。这个想法是,一旦您决定 Cassandra 是您的企业运营数据的首选数据存储,那么 DSE/Solr 集成就允许您对该数据执行丰富的搜索。

大型企业正在寻求从传统的关系数据库迁移到更现代的平台,例如 NoSQL 数据库,例如 Cassandra,其中可扩展性和分布式计算(包括多数据中心支持、可调一致性和强大的操作工具,包括 OpsCenter GUI仪表板)是常态。DSE 的 Solr 集成促进了这种迁移。

于 2014-06-29T20:14:32.110 回答
0

关于您的收入,该链接指向启动计划。如果您符合条件,这将使该软件 100% 免费。

于 2013-11-11T13:04:03.163 回答