问题标签 [cloudwatch-alarms]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
amazon-web-services - 在一个资源中查找两个列表
我正在尝试在 aws 中为 UnHealthyHostCountmetric 的 NLB 创建 cloudwatch 警报
我将 NLB 定义为:
我将目标群体定义为:
然后我在它们上使用数据源:
然后我试图在警报中使用两者
由于警报已经在使用 for_each = data.aws_lb_target_group.my_lb_target_group ,我如何同时提供 data.aws_lb.my_lbs 中的值,这是dimentions-LoadBalancer所需要的
amazon-web-services - 删除 EC2 实例后,AWS 警报始终处于“警报状态”
我在队列指标上设置了2 个 CloudWatch 警报。将一批文件上传到 S3 存储桶后,警报会注意预定义的值(在本例中为 10),并相应地启动/终止实例,以便我的应用程序适当地自动扩展。
但是,由于一旦我的队列上的消息数量少于 10 条,其中一个警报就会终止实例,因此由于可用消息少于 10 条,它在某一时刻一直处于“警报”状态。
有什么简单的方法可以解决这个问题吗?
amazon-web-services - 向 CloudFormation 模板添加自定义指标
我需要在 CloudFormation 中添加一个触发回滚的警报。我已经决定添加一个可以手动分配的自定义指标。我在这里查看文档。这看起来可以工作,但我需要将它添加到模板中。这可能吗?我最初认为的值将是 0 次失败,如下所示
当我想触发回滚时,我会将其设置为 1
namespace
但是我需要将其放在模板中,以便在定义警报时可以访问正确/动态的值。
amazon-web-services - Cloud Watch 警报中的“期间”如何真正起作用?
我正在构建一个云监视警报,以在 5 分钟内未调用 lambda 函数时发送电子邮件
因此,当调用该函数时,调用指标变为 1,警报进入 OK 状态。但是,当超过 5 分钟没有调用该函数时,警报不会回到 ALARM 状态。实际上,进入 ALARM 状态大约需要 15 分钟。
如果我设置了一个次要时间段,则返回警报状态确实需要更少的时间。我不明白期间是如何真正起作用的。
有谁知道这种配置在 Cloud Watch Alarm 中是否真的可行?我应该如何确定在 5 分钟内收到电子邮件的期限和评估期?
amazon-web-services - Terraform Cloudwatch 警报 - 维度配置
假设我有这个警报:
在维度下,我在 AWS 文档中看到只有几个可用的 EC2 实例维度是(例如实例 ID - 等....)。在我的项目中,我使用一个名为“Type”的标签将我的实例分类为 HTTP 或 APP 实例。有没有办法根据这些标签作为维度创建警报?意思是为带有标签“Http”的实例创建警报,并为标记为“App”的实例创建警报。非常感谢你。 https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/viewing_metrics_with_cloudwatch.html#ec2-cloudwatch-dimensions
terraform - 如何将 AWS 警报 ARN 收集到 Terraform 中的字符串中以在 CloudWatch 仪表板创建 JSON 中使用?
我正在使用 Terraform 创建一组 CloudWatch 警报,如下所示:
所以它使用for_each
函数名称列表。
接下来,我需要创建一个 CloudWatch 仪表板。它显然是通过提供具有相关名称(文档)的 JSON 来创建的:
如何在变量中收集创建的警报 ARN 并将其插入仪表板 JSON?
amazon-web-services - 如何通过 StatusCheckFailed_Instance 指标使用 Cloudwatch 警报恢复 EC2(不是 StatusCehckFailed_System 指标!!!)
我正在寻找一种在实例失败时自动恢复 EC2 的解决方案,通过操作系统错误进行状态检查。
由于应用程序的OOM(Out of memory)或High disk IO的OOM,磁盘吞吐量太高,其中一个实例经常无法进行状态检查。如果某些实例因操作系统错误而出现问题,指示 CloudWatch 指标中的 StatusCheckFailed_instance
有时重启没有解决失败状态检查问题,需要停止和启动实例,甚至是 StatusCheckFailed_instance。但是当指标为 StatusCheckFailed_instance 时,CloudWatch 警报不会为问题实例提供恢复(停止和启动)操作...仅在 StatusCheckFailed_System 时提供。 https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/UsingAlarmActions.html#AddingRecoverActions
得到StatusCheckFailed_instance时如何自动恢复问题实例????
amazon-web-services - 更改布尔值时触发 AWS CloudWatch 警报
我想创建一个 AWS CloudWatch 警报/事件,当布尔值从 1 更改为 0 或从 0 更改为 1 时触发。例如 ElasticCache 的 SaveInProgress。怎么能创造呢?
我的理解是:当前的 AWS CloudWatch 警报只有在阈值大于、小于等情况下才能触发。