问题标签 [cloudwatch-alarms]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
91 浏览

amazon-web-services - 在一个资源中查找两个列表

我正在尝试在 aws 中为 UnHealthyHostCountmetric 的 NLB 创建 cloudwatch 警报

我将 NLB 定义为:

我将目标群体定义为:

然后我在它们上使用数据源:

然后我试图在警报中使用两者

由于警报已经在使用 for_each = data.aws_lb_target_group.my_lb_target_group ,我如何同时提供 data.aws_lb.my_lbs 中的值,这是dimentions-LoadBalancer所需要的

0 投票
0 回答
28 浏览

amazon-web-services - 删除 EC2 实例后,AWS 警报始终处于“警报状态”

我在队列指标上设置了2 个 CloudWatch 警报。将一批文件上传到 S3 存储桶后,警报会注意预定义的值(在本例中为 10),并相应地启动/终止实例,以便我的应用程序适当地自动扩展。

但是,由于一旦我的队列上的消息数量少于 10 条,其中一个警报就会终止实例,因此由于可用消息少于 10 条,它在某一时刻一直处于“警报”状态。

有什么简单的方法可以解决这个问题吗?

0 投票
2 回答
1046 浏览

amazon-web-services - 向 CloudFormation 模板添加自定义指标

我需要在 CloudFormation 中添加一个触发回滚的警报。我已经决定添加一个可以手动分配的自定义指标。我在这里查看文档。这看起来可以工作,但我需要将它添加到模板中。这可能吗?我最初认为的值将是 0 次失败,如下所示

当我想触发回滚时,我会将其设置为 1

namespace但是我需要将其放在模板中,以便在定义警报时可以访问正确/动态的值。

0 投票
1 回答
1547 浏览

amazon-web-services - Cloud Watch 警报中的“期间”如何真正起作用?

我正在构建一个云监视警报,以在 5 分钟内未调用 lambda 函数时发送电子邮件

因此,当调用该函数时,调用指标变为 1,警报进入 OK 状态。但是,当超过 5 分钟没有调用该函数时,警报不会回到 ALARM 状态。实际上,进入 ALARM 状态大约需要 15 分钟。

如果我设置了一个次要时间段,则返回警报状态确实需要更少的时间。我不明白期间是如何真正起作用的。

有谁知道这种配置在 Cloud Watch Alarm 中是否真的可行?我应该如何确定在 5 分钟内收到电子邮件的期限和评估期?

0 投票
1 回答
1816 浏览

amazon-web-services - S3 存储桶不显示指标

我创建了一个 S3 存储桶并通过在其中上传一些文件来填充它。但是我无法验证我的用例来检查存储桶大小,因为总存储桶大小的默认指标始终不返回任何数据。注意:我在 AWS 控制台 UI 中使用默认设置创建了存储桶。

我等了一个多星期,即便如此,我仍然在 Metrics 选项卡下看不到任何数据,因此 s3 存储桶也没有在 cloudwatch 中列出来配置警报。

有没有人遇到过类似的问题并帮助解决它?附上我的 S3 存储桶的 Metrics 选项卡的屏幕截图以供参考,在此处输入图像描述

0 投票
1 回答
551 浏览

amazon-web-services - Terraform Cloudwatch 警报 - 维度配置

假设我有这个警报:

在维度下,我在 AWS 文档中看到只有几个可用的 EC2 实例维度是(例如实例 ID - 等....)。在我的项目中,我使用一个名为“Type”的标签将我的实例分类为 HTTP 或 APP 实例。有没有办法根据这些标签作为维度创建警报?意思是为带有标签“Http”的实例创建警报,并为标记为“App”的实例创建警报。非常感谢你。 https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/viewing_metrics_with_cloudwatch.html#ec2-cloudwatch-dimensions

0 投票
1 回答
325 浏览

amazon-web-services - 尽管没有数据,CloudWatch 警报仍处于 ALARM 状态

我有一个基于 DynamoDB 指标 WriteThrottleEvents 的 CloudWatch 警报。9 月份有一个油门数据点导致警报进入 ALARM 状态,但此后没有其他油门数据点,但警报仍处于 ALARM 状态。警报之前将“处理丢失的数据”设置为ignore(最初解释了为什么它保持在 ALARM 状态),但是我现在将其更改为missing,但警报仍处于 ALARM 状态,尽管没有数据点。为什么它没有将状态更改为“数据不足”? 在此处输入图像描述

0 投票
1 回答
98 浏览

terraform - 如何将 AWS 警报 ARN 收集到 Terraform 中的字符串中以在 CloudWatch 仪表板创建 JSON 中使用?

我正在使用 Terraform 创建一组 CloudWatch 警报,如下所示:

所以它使用for_each函数名称列表。

接下来,我需要创建一个 CloudWatch 仪表板。它显然是通过提供具有相关名称(文档)的 JSON 来创建的:

如何在变量中收集创建的警报 ARN 并将其插入仪表板 JSON?

0 投票
0 回答
90 浏览

amazon-web-services - 如何通过 StatusCheckFailed_Instance 指标使用 Cloudwatch 警报恢复 EC2(不是 StatusCehckFailed_System 指标!!!)

我正在寻找一种在实例失败时自动恢复 EC2 的解决方案,通过操作系统错误进行状态检查。

由于应用程序的OOM(Out of memory)或High disk IO的OOM,磁盘吞吐量太高,其中一个实例经常无法进行状态检查。如果某些实例因操作系统错误而出现问题,指示 CloudWatch 指标中的 StatusCheckFailed_instance

有时重启没有解决失败状态检查问题,需要停止和启动实例,甚至是 StatusCheckFailed_instance。但是当指标为 StatusCheckFailed_instance 时,CloudWatch 警报不会为问题实例提供恢复(停止和启动)操作...仅在 StatusCheckFailed_System 时提供。 https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/UsingAlarmActions.html#AddingRecoverActions

得到StatusCheckFailed_instance时如何自动恢复问题实例????

0 投票
1 回答
243 浏览

amazon-web-services - 更改布尔值时触发 AWS CloudWatch 警报

我想创建一个 AWS CloudWatch 警报/事件,当布尔值从 1 更改为 0 或从 0 更改为 1 时触发。例如 ElasticCache 的 SaveInProgress。怎么能创造呢?

我的理解是:当前的 AWS CloudWatch 警报只有在阈值大于、小于等情况下才能触发。