我面临建立生产就绪的弹性搜索集群的问题。目前我只在elasticsearch中存储测试日志文件。
到目前为止一切顺利,但由于我们每天有 1TB 的生产日志,我想知道如何为这个用例正确设置弹性搜索索引。
我们希望将这些日志保存 30 天。集群设置有 100TB 磁盘空间。我想选择 Replica Count 为 3,所以使用的磁盘空间应该在 90TB 左右。
但是我应该分配多少分片?
Elastic 中的 Shards 和 Lucene Segments 之间有区别吗?
我面临建立生产就绪的弹性搜索集群的问题。目前我只在elasticsearch中存储测试日志文件。
到目前为止一切顺利,但由于我们每天有 1TB 的生产日志,我想知道如何为这个用例正确设置弹性搜索索引。
我们希望将这些日志保存 30 天。集群设置有 100TB 磁盘空间。我想选择 Replica Count 为 3,所以使用的磁盘空间应该在 90TB 左右。
但是我应该分配多少分片?
Elastic 中的 Shards 和 Lucene Segments 之间有区别吗?
您应该阅读 Val 发送的文章。但如果是日志,您可以每天创建一个索引,此策略可以让您尝试不同的配置。
副本数应取决于您的弹性搜索节点数。
您还可以阅读这篇短文: https ://www.elastic.co/guide/en/elasticsearch/guide/current/_how_primary_and_replica_shards_interact.html
如果您对副本数有疑问,这个也可以帮助您: https ://codingexplained.com/coding/elasticsearch/understanding-replication-in-elasticsearch