我正在部署一个 AutoScalingGroup,其中 AutoScalingPolicies (ScaleUp & ScaleDown) 由 CloudWatch Alarm 触发(CPU > 70%, CPU < 10%)
。
AutoScaling 运行良好,但是...一旦 AutoScalingGroup 达到最小实例数 (2),CPU < 10%
警报会持续ALARM STATE
数小时...天...而不会重置为OK STATE
.
因为 CPU 利用率保持在 10% 以下,所以我知道警报永远不会回到OK STATE
.
我知道它的存在AlarmActions
类似于:
arn:aws:automate:${AWS::Region}:ec2:recover
(对于 EC2)
我搜索了类似的 Cloudwatch 操作,没有找到任何东西。
我有一个自定义解决方案:使用 Lambda 更改Alarm State to OK
但我想知道是否存在更智能/更简单的解决方案。
有人知道该怎么做吗?
谢谢。