问题标签 [cloudwatch-alarms]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
192 浏览

amazon-web-services - CloudFormation 堆栈中多个 Lambda 函数的 CloudWatch 警报

我正在使用SAMCloudFormation部署多种Lambda功能和其他资源。函数名称由以下格式生成CloudFormation并具有以下格式:

stack-name-function-name-8H2609XXXXX带有自动生成的后缀CloudFormation

CloudWatch因此,为所有单个功能自动创建的日志组Lambda具有以下名称格式:

/aws/lambda/stack-name-function-name-8H2609XXXXX

我正在尝试找到一种方法来触发堆栈CloudWatch Alarm中的Lambda函数。在创建MetricFilter时,CloudFormation我必须指定CloudWatch LogGroupName. 有 100 个Lambdas由 生成的名称CloudFormation,遵循基本模式意味着创建 100 个过滤器,它们必须以某种方式知道所有函数的名称(可能是输出和导入,但是当函数名称更改时这将非常不灵活,需要不断重新部署我希望保留过滤器的“警报”堆栈)

有没有办法为一组日志组触发警报?我想象在日志组名称的过滤器上使用通配符会很容易,例如/aws/lambda/stack-name-*. 还是比必须管理所有过滤器更好的方法?

0 投票
0 回答
96 浏览

amazon-ec2 - AWS cloudwatch 为单个事件发送两个警报通知

如果内存使用量超过 90%,我正在使用 AWS cloudwatch 监控和发送警报。这已配置 SNS 主题以传递警报通知。

每当内存使用率超过 90% 时,意味着使用此单个事件获取 2 条警报消息,并且不确定为什么会触发重复邮件。

报警条件,

0 投票
0 回答
76 浏览

amazon-web-services - AWS CloudWatch 警报图未显示某些点

我已将 CloudWatch 警报配置为检查 Firehose 传输流中的“DeliveryToS3.DataFreshness”指标,其中包含“最大”统计数据和 60 秒的周期。Firehose 传输流将消息缓冲 300 秒或高达 5Mb。

所以我希望看到一个图表上升 5 分钟,然后下降到 0 并再次上升(消息的年龄 60 秒、120 秒、180 等等......每次检查)。

但是该图仅显示了最高点:301 秒,302 秒(我不知道它取决于什么),甚至没有改变状态(我尝试设置阈值 = 100,评估期 = 5 和数据点警报 = 3所以它应该会报警,但它甚至不会因为数据不足而变为 OK)。

当前报警状态

而且它似乎忽略了我的 Period 参数,只是每 5 分钟而不是 1 分钟检查一次状态。

也许我错过了什么?

0 投票
0 回答
157 浏览

amazon-web-services - 手动触发 CloudWatch 事件警报

我有这样的场景:

我有一个死信队列,当消息进入其中时,应触发 CloudWatch 警报。

我尝试使用为 SQS 提供的指标直接设置警报,最接近的是NumberOfMessagesSent指标。但这并不能完成我的工作。

我想到的下一个方法是触发一个 CloudWatch 事件,该事件在我向 DLQ 发送消息时触发,并在触发该事件时触发警报。我没有找到任何文件说这样的事情是可能的。

有没有办法在将新消息添加到队列时触发 CloudWatch 警报SQS

0 投票
1 回答
73 浏览

amazon-web-services - 多实例cpuutilization告警,数据不足

我使用异常检测创建了一个 CPU 利用率警报,这显示了一个带有预期 cpu 利用率(异常检测带)的图表,但警报显示“数据不足”并且没有 cpuutilization 的图形线。

aws cloudwatch describe-alarms给出以下输出,显示配置的指标(删除了帐户 ID)

0 投票
1 回答
315 浏览

amazon-web-services - CW 警报维度中的参考实例 ID - Terraform

我正在向日志管道添加警报/监控。具体来说,我正在创建 CW 警报,这些警报会在 Auto Scaling 组中的 EC2 实例的磁盘/内存利用率超过 50% 时触发。ASG 在“workers”模块目录中创建,并输出伸缩组名称以供在“cloudwatch”模块目录中创建警报时参考。

我很难理解有关创建此警报的一些事情:

  • 在警报创建中是否必须引用指标的所有维度?
  • 如果是这样,当 TF 文件中仅定义目标组/缩放组时,如何引用 InstanceID?

在“警报”父模块中:

在“工人”父模块中:

0 投票
1 回答
131 浏览

amazon-web-services - CloudWatch 指标和警报中的“总和”如何工作?

CloudWatchAlarm

抱歉,图片太大了,但这是传达我正在努力理解的内容的最佳方式。这是一个简单的警报,当 lambda 在 1 小时内产生 10 个或更多错误时应触发。应该很简单,基本的东西。

那么为什么当指标没有超过如图所示的阈值(绿色框)时,此警报会进入 ALARM 状态。底部的新(?)栏是警报的状态。

所有相关设置都应该在屏幕截图中,它只是“1 小时内的错误总和”

我可以调整阈值来解决这种奇怪的问题,但我猜这不是 AWS 错误,而是我无法理解。我想明白。

0 投票
2 回答
321 浏览

terraform - 由于 heredoc,Cloudwatch 警报创建失败

我正在尝试使用 terraform 创建复合 cloudwatch 警报。但不幸的是,我的 terraform 代码因以下错误而中断:

错误:创建 CloudWatch 复合警报时出错 (node-count-office-time-composite-alarm-DP-1474-desert):ValidationError:AlarmRule 不得包含前导或尾随空格或为空状态代码:400,请求 ID:272b14ae- e6bd-4e65-8bb8-25372d9a5f7c

以下是我的地形代码:

我检查了很多次,我的 alarm_rule 中没有前导或尾随空格。AND 运算符后只有新行。我正在使用 terraform 0.15.3 版本。任何人都面临类似的问题,我该如何解决这个问题?谢谢

0 投票
1 回答
1061 浏览

amazon-web-services - 警报预算和 Cloudwatch 警报计费有什么区别?

我想了解 usgin Budgets (cost buget) 和 Configure Billing Alerts 的区别什么?在 AWS

0 投票
1 回答
235 浏览

amazon-web-services - 指标过滤器未分配给指标警报

我正在使用 terraform 设置 aws cloudwatch 日志,以便在日志中出现错误时发送电子邮件。

这是 terraform 文件的样子:

运行 terraform apply 后,我可以看到过滤器已创建,警报也已创建。但是在警报部分下,没有列出警报。您可以在图中看到,有 2 个过滤器,左侧的过滤器列出了警报名称,右侧的过滤器不显示。左边的那个是在 aws 控制台上手动创建的,右边的那个是来自 terraform 的。确实,在控制台上创建的那个就像一个魅力,但右边的那个仍然处于数据不足状态 过滤指标