我不确定这是否是这个问题的正确论坛,但如果我能指出正确的方向,那就太好了。我们一直在使用 MySql 和 Solr 的组合来满足我们公司的所有全文和查询需求。但是随着我们客户的增长,数据量也在增长,而 MySql 并没有被证明是存储/查询的正确选择。
我一直在研究 Solr Cloud,它看起来确实令人印象深刻,但不确定我们是否应该放弃我们的存储系统。所以,我一直在探索 DataStax,但商业选择是不可能的。所以我们考虑使用 hbase 来存储数据,同时将数据索引到 Solr 云中,但是由于许多原因,这种设计似乎并不令人信服(也见基本的 Lilly)。
是否建议仅使用具有多个复制的用户 Solr 云或 hbase-solr 似乎是不错的选择
将 Solr Shard 和 Hbase 节点保持在同一台机器上会有多大的压力
- 有没有计算我需要什么样的机器配置来存储 500-10 亿条记录。其中大部分是社交数据(Twitter/facebook/blogs 等)和分片数量。
问候,
阿尤什