2

我不确定这是否是这个问题的正确论坛,但如果我能指出正确的方向,那就太好了。我们一直在使用 MySql 和 Solr 的组合来满足我们公司的所有全文和查询需求。但是随着我们客户的增长,数据量也在增长,而 MySql 并没有被证明是存储/查询的正确选择。

我一直在研究 Solr Cloud,它看起来确实令人印象深刻,但不确定我们是否应该放弃我们的存储系统。所以,我一直在探索 DataStax,但商业选择是不可能的。所以我们考虑使用 hbase 来存储数据,同时将数据索引到 Solr 云中,但是由于许多原因,这种设计似乎并不令人信服(也见基本的 Lilly)。

  1. 是否建议仅使用具有多个复制的用户 Solr 云或 hbase-solr 似乎是不错的选择

  2. 将 Solr Shard 和 Hbase 节点保持在同一台机器上会有多大的压力

  3. 有没有计算我需要什么样的机器配置来存储 500-10 亿条记录。其中大部分是社交数据(Twitter/facebook/blogs 等)和分片数量。

问候,

阿尤什

4

1 回答 1

0

据我所知,最好将 HBase 和一般 NoSQL 作为混合解决方案与 MySQL 和 Oracle 等关系数据库结合使用,这就是 Facebook 和其他人所做的。他们不会完全离开关系数据库。还有一点,MySQL失效后的解决方案不一定是HBase。您可以尝试为大规模数据存储而设计的 Oracle。

抱歉英语不好。

于 2013-11-11T10:52:04.370 回答