1

随着分布式 Solr 的主从实现(在 Solr 4.x 之前),让 master 承担索引、合并和优化索引的负载是一个直接的设计解决方案。然后索引被复制到副本,同时副本始终提供搜索服务。

有人可以解释一下 SolrCloud 现在是如何完成的吗?似乎 SolrCloud 从领导者向每个副本发送索引命令。但是如何实现搜索性能呢?在每个副本上进行索引和搜索会在每个节点服务器上产生负载(在后台索引和运行合并线程),并且由于我的索引很大,因此通常需要花费大量时间来合并段或简单地优化。我现在应该把所有这些都交付给合并策略而不用担心吗?TieredMergePolicy 是否同时提供良好的搜索性能和低资源负载(CPU、I/O)?

4

1 回答 1

0

我将尝试回答您的部分问题:SolrCloud 确实在所有节点上都有索引,因此它对副本有性能影响。这是由于“热复制”模型而不是您习惯的“冷复制”模型而完成的。它旨在解决数据完整性问题以及集群上的实时搜索。作为性能影响的代价,您可以获得一致的数据和更快的数据可用性。实际上,您始终可以将数据拆分为分片(以额外硬件为代价),并具有可比的性能。无论哪种情况,您都可以决定 SolrCloud 是否适合您的需求。您可以在没有云模型的情况下使用 Solr 4,并像以前一样自行管理它。

于 2013-07-26T08:08:46.887 回答