6

我有 6 个 m3.large.elasticsearch 类型实例和存储类型实例。

在此处输入图像描述

我真的不明白平均,最小,最大......这里的意思是什么?

我现在没有任何日志进入我的集群,尽管它在这里显示 FreeStorageSpace 为 14.95GB:

在此处输入图像描述

但是我的“最小值”的 FreeStorageSpace 图表已达到零!

在此处输入图像描述

这里发生了什么?

4

2 回答 2

6

我也对此感到困惑。最小意味着单个数据节点上的大小 - 一个具有最少可用空间的节点。Sum 表示整个集群的大小(所有数据节点上可用空间的总和)。从以下链接获得此信息

http://docs.aws.amazon.com/elasticsearch-service/latest/developerguide/es-managedomains.html

于 2017-05-26T00:21:10.467 回答
2

我们遇到了同样的困惑。Avg, Min, Max 将计算分布在所有节点上,Sum 结合了整个集群的可用/已用空间。

我们假设 Average FreeStorageSpace 是指整个集群的平均可用存储空间,并设置警报,同时牢记以下计算:

  1. 每天索引 = 1 TB
  2. 保留索引的最大天数 = 10

因此,我们在任何时间点的平均利用率为 10 TB。假设,我们将按照https://docs.aws.amazon.com/elasticsearch-service/latest/developerguide/sizing-domains.html#aes-bp-storage复制2 倍 - 即 20 TB 我们的实际存储需求因子 2 是:

(20 * 2 * 1.1 / 0.95 / 0.8) = 57.89 =~ 60 TB

因此,我们预置了 18 X 3.8 TB 实例 =~ 68 TB 以容纳 2x = 60 TB

所以我们设置了一个警报,如果我们低于 8 TB 的免费存储空间 - 这意味着我们已经达到了 2 倍的限制并且应该扩大规模。因此我们设置了闹钟

5 分钟内 4 个数据点的 FreeStorageSpace <= 8388608.00 + 统计 = 平均 + 持续时间 = 1 分钟

FreeStorageSpace 以 MB 为单位,因此 - 8 TB = 8388608 MB。

但我们立即收到警报,因为我们每个节点的平均利用率低于 8 TB。

在意识到要获得准确的存储空间后,您需要对 FreeStorageSpace 求和 1 分钟 - 我们将警报设置为

5 分钟内 4 个数据点的 FreeStorageSpace <= 8388608.00 + 统计 = 总和 + 持续时间 = 1 分钟

上面的计算得到了检验,我们能够设置正确的警报。

这同样适用于 ClusterUsedSpace 计算。

您还应该使用 Cloudwatch Math 跟踪实际可用空间百分比:

在此处输入图像描述

于 2018-12-13T10:48:49.330 回答