1

在我看到的所有文献中,SolrCloud 的可扩展性似乎只涉及查询。意思是,复制和分片将客户端查询的负载分布在更大的 CPU 和更宽的带宽上。

但是索引呢?

SolrCloud 的可扩展性是否提高了索引性能?可以配置为加快索引时间吗?就我而言,我们需要经常向索引提交新内容;这种特殊情况会改变什么吗?

Mark Miller 在 Lucene Revolution 2012 上的演讲引人入胜,涵盖了索引的一些细节。但似乎某些云功能(如复制)可能会使索引速度变慢,而不是更快。有人试过 SolrCloud 吗?

4

2 回答 2

0

好吧,我终于能够建立一个合适的云环境进行测试,并且简单地说,即使使用 RAMDirectory,索引速度也注定要失败。我不知道索引速度是否与云中的追随者数量或集合数量有关,但是具有 1 个领导者 2 个追随者结构和 8 个集合会使索引速度慢 4 到 5 倍。我能够在 17 分钟内索引大约 350 万个文档,而对于云中的每个实例使用相同的配置,我只能在 17 分钟内索引 65 万个文档......我不知道如何加快 SolrCloud 索引速度和一些惊讶地看到我对云的期望被一一摧毁,因为我在处理它时不断收到新的错误和问题。

如果这也发生在任何其他设置上,我不明白将云用于 Solr 有什么意义。我的意思是,如果索引速度提高这么多,我可以更快地重新索引经典独立 solr 实例上的所有内容。

如果有人尝试过或有人在真实环境中使用过 SolrCloud,那么看到其他一些经验会非常好

于 2012-11-27T02:35:00.873 回答
0

您将哪个版本的 solr 用于 solr cloud?Solr 云自 solr 4.8 版本以来非常稳定。

  1. 您可以通过不频繁地硬提交文档来提高索引速度,而是分批提交,即在 45 或 60 秒之后。这可以通过 solr config 中的自动提交配置来实现 -

  2. 虽然硬提交可确保将数据刷新到稳定的存储中,但它不会使更改可见,这是通过软提交标签实现的。将软提交的值设置为 90-120 秒左右。这也可以通过 solr config 中的软提交配置来实现 -

于 2015-01-19T10:45:14.447 回答