问题标签 [cloudwatch-alarms]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
amazon-web-services - CloudFormation 堆栈中多个 Lambda 函数的 CloudWatch 警报
我正在使用SAM
并CloudFormation
部署多种Lambda
功能和其他资源。函数名称由以下格式生成CloudFormation
并具有以下格式:
stack-name-function-name-8H2609XXXXX
带有自动生成的后缀CloudFormation
CloudWatch
因此,为所有单个功能自动创建的日志组Lambda
具有以下名称格式:
/aws/lambda/stack-name-function-name-8H2609XXXXX
我正在尝试找到一种方法来触发堆栈CloudWatch Alarm
中的Lambda
函数。在创建MetricFilter
时,CloudFormation
我必须指定CloudWatch LogGroupName
. 有 100 个Lambdas
由 生成的名称CloudFormation
,遵循基本模式意味着创建 100 个过滤器,它们必须以某种方式知道所有函数的名称(可能是输出和导入,但是当函数名称更改时这将非常不灵活,需要不断重新部署我希望保留过滤器的“警报”堆栈)
有没有办法为一组日志组触发警报?我想象在日志组名称的过滤器上使用通配符会很容易,例如/aws/lambda/stack-name-*
. 还是比必须管理所有过滤器更好的方法?
amazon-ec2 - AWS cloudwatch 为单个事件发送两个警报通知
如果内存使用量超过 90%,我正在使用 AWS cloudwatch 监控和发送警报。这已配置 SNS 主题以传递警报通知。
每当内存使用率超过 90% 时,意味着使用此单个事件获取 2 条警报消息,并且不确定为什么会触发重复邮件。
报警条件,
amazon-web-services - AWS CloudWatch 警报图未显示某些点
我已将 CloudWatch 警报配置为检查 Firehose 传输流中的“DeliveryToS3.DataFreshness”指标,其中包含“最大”统计数据和 60 秒的周期。Firehose 传输流将消息缓冲 300 秒或高达 5Mb。
所以我希望看到一个图表上升 5 分钟,然后下降到 0 并再次上升(消息的年龄 60 秒、120 秒、180 等等......每次检查)。
但是该图仅显示了最高点:301 秒,302 秒(我不知道它取决于什么),甚至没有改变状态(我尝试设置阈值 = 100,评估期 = 5 和数据点警报 = 3所以它应该会报警,但它甚至不会因为数据不足而变为 OK)。
而且它似乎忽略了我的 Period 参数,只是每 5 分钟而不是 1 分钟检查一次状态。
也许我错过了什么?
amazon-web-services - 手动触发 CloudWatch 事件警报
我有这样的场景:
我有一个死信队列,当消息进入其中时,应触发 CloudWatch 警报。
我尝试使用为 SQS 提供的指标直接设置警报,最接近的是NumberOfMessagesSent
指标。但这并不能完成我的工作。
我想到的下一个方法是触发一个 CloudWatch 事件,该事件在我向 DLQ 发送消息时触发,并在触发该事件时触发警报。我没有找到任何文件说这样的事情是可能的。
有没有办法在将新消息添加到队列时触发 CloudWatch 警报SQS
?
amazon-web-services - 多实例cpuutilization告警,数据不足
我使用异常检测创建了一个 CPU 利用率警报,这显示了一个带有预期 cpu 利用率(异常检测带)的图表,但警报显示“数据不足”并且没有 cpuutilization 的图形线。
aws cloudwatch describe-alarms
给出以下输出,显示配置的指标(删除了帐户 ID)
amazon-web-services - CW 警报维度中的参考实例 ID - Terraform
我正在向日志管道添加警报/监控。具体来说,我正在创建 CW 警报,这些警报会在 Auto Scaling 组中的 EC2 实例的磁盘/内存利用率超过 50% 时触发。ASG 在“workers”模块目录中创建,并输出伸缩组名称以供在“cloudwatch”模块目录中创建警报时参考。
我很难理解有关创建此警报的一些事情:
- 在警报创建中是否必须引用指标的所有维度?
- 如果是这样,当 TF 文件中仅定义目标组/缩放组时,如何引用 InstanceID?
在“警报”父模块中:
在“工人”父模块中:
terraform - 由于 heredoc,Cloudwatch 警报创建失败
我正在尝试使用 terraform 创建复合 cloudwatch 警报。但不幸的是,我的 terraform 代码因以下错误而中断:
错误:创建 CloudWatch 复合警报时出错 (node-count-office-time-composite-alarm-DP-1474-desert):ValidationError:AlarmRule 不得包含前导或尾随空格或为空状态代码:400,请求 ID:272b14ae- e6bd-4e65-8bb8-25372d9a5f7c
以下是我的地形代码:
我检查了很多次,我的 alarm_rule 中没有前导或尾随空格。AND 运算符后只有新行。我正在使用 terraform 0.15.3 版本。任何人都面临类似的问题,我该如何解决这个问题?谢谢
amazon-web-services - 警报预算和 Cloudwatch 警报计费有什么区别?
我想了解 usgin Budgets (cost buget) 和 Configure Billing Alerts 的区别是什么?在 AWS