1

我有一个关于不健康主机的警报,它在部署期间发出警报并打开和关闭 ECS 服务。我已尝试按照此处HealthCheckGracePeriodSeconds : 600的建议添加,这将允许 10 分钟的启动时间,这对于服务开始响应健康检查来说已经足够了,但仍然会发出警报。

我真的不想更改警报,因为我希望它对环境中可能发生的任何问题都非常敏感,但可能会被迫因为此时我设置的警报可能有点嘈杂。

4

1 回答 1

1

健康检查宽限期只是忽略警报的结果。这意味着10分钟内即使警报响起也不会更换。

如果您对 UnHealthyHostCount 感到担忧,则需要调整监控解决方案的某些部分,以避免发生这种交叉时的情况。

请记住,其中一个与 ECS 服务有关,它只是在监听它是否健康,而另一个完全是负载均衡器,它对不健康的主机发出警报。

于 2020-07-15T06:19:07.747 回答