问题标签 [cloudwatch-alarms]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
959 浏览

amazon-cloudwatch - 为 AWS Fargate 设置 Cloudwatch 警报上限和下限阈值

我创建了一个自动缩放目标和一个附加到它的策略。

这将创建 cloudwatch 警报:

高的: 3 datapoints within 3 minutes

低的: 15 datapoints within 15 minutes

我想将其自定义为:

高的: 1 datapoint within 1 minute

低的: 1 datapoint within 1 minute

我可以从 AWS 控制台手动执行此操作。但是,正在努力寻找一种使用 cloudformation 模板执行相同操作的方法。

0 投票
1 回答
2628 浏览

amazon-cloudwatch - 为什么 AWS CloudWatch 警报无法向加密的 SNS 主题发送通知?

如果我的 lambda 函数内存使用量超过 lambda 内存大小的 80%,我会设置警报来通知我。我正在使用自定义指标捕获数据点,并且当内存使用量超过阈值时,我能够在 cloudwatch 控制台中看到警报。但是,当 Alarm 采取操作向相应的 SNS 主题发送通知时失败并显示以下消息:

}

SNS 主题使用 KMS 密钥加密,我允许 cloudwatch 访问密钥策略中的密钥:

但行动仍然失败。我也尝试过events.amazonaws.com担任校长,但没有运气。我很感激这方面的任何帮助。

0 投票
1 回答
136 浏览

boto3 - 为初始 AWS 应用程序自动扩展添加延迟

我正在使用 boto3 将自定义应用程序自动缩放策略应用于两个 HTTP 端点,这会增加每个端点的实例数。这些策略是根据单个队列的大小触发的。例如,两个端点都有警报,当队列大于 1000 时会触发扩展。目前,只要此警报变为高,两个端点就会开始扩展。

端点 #1 需要 3 分钟才能完成横向扩展,而端点 #2 需要 7 分钟才能完成横向扩展。问题是端点 #1 将数据发送到端点 #2,所以我需要端点 #2 在端点 #1 之前完成扩展。

因此,我正在尝试找到一种方法来为端点 #1 的 scale-out 添加时间延迟。看起来该scale_out_cooldown参数仅在缩放事件之间添加了时间延迟,而不是在我想要的初始触发时。有没有办法将警报触发的初始横向扩展事件延迟设定的秒数?

0 投票
3 回答
1327 浏览

amazon-web-services - 如何为 beanstalk 环境内存设置 cloudwatch 警报

我正在尝试为 AWS Elastic Beanstalk 环境的所有实例上的内存设置 Cloudwatch 警报。我已经使用以下教程设置了在 Cloudwatch 上获取内存使用情况的功能:

https://docs.aws.amazon.com/elasticbeanstalk/latest/dg/customize-containers-cw.html

现在我想设置一个警报,如果任何这些实例的 MemoryUtilization 超过某个阈值,就会触发该警报。我可以选择所有并分别设置警报,但我想确保即使 Beanstalk 扩展集群或交换实例,也不必重新配置警报。

有没有一种方法可以为实例名称 =“env-name”且指标为 MemoryUtilization 的情况设置警报?

0 投票
1 回答
476 浏览

amazon-web-services - 在 Lambda 函数上设置持续时间警报的最佳值

我有一个可以做一些工作的 lambda 函数。我想在 lambda 的持续时间内在其上创建一个 cloudwatch 警报,即这个 lambda 运行需要多少时间?

我尝试对警报使用以下值,但我遇到了这个警报的问题,可能是由于冷启动问题。以下是我设置的值:

我面临的问题是,由于冷启动问题,它一直处于警报状态,可能是因为它不经常被调用。

为 lambda 设置的最佳值是多少?其他人如何在 lambda 上设置警报?

另外,如果 lambda 没有被调用多少时间,那么它会被关闭并且会出现冷启动问题?

0 投票
2 回答
3005 浏览

amazon-web-services - AWS CloudWatch 触发时自动重置 (OK) 警报

我正在部署一个 AutoScalingGroup,其中 AutoScalingPolicies (ScaleUp & ScaleDown) 由 CloudWatch Alarm 触发(CPU > 70%, CPU < 10%)

AutoScaling 运行良好,但是...一旦 AutoScalingGroup 达到最小实例数 (2),CPU < 10%警报会持续ALARM STATE数小时...天...而不会重置为OK STATE.

因为 CPU 利用率保持在 10% 以下,所以我知道警报永远不会回到OK STATE.

我知道它的存在AlarmActions类似于:

arn:aws:automate:${AWS::Region}:ec2:recover(对于 EC2)

我搜索了类似的 Cloudwatch 操作,没有找到任何东西。

我有一个自定义解决方案:使用 Lambda 更改Alarm State to OK但我想知道是否存在更智能/更简单的解决方案。

有人知道该怎么做吗?

谢谢。

0 投票
0 回答
50 浏览

amazon-web-services - 绝对初学者在哪里可以学习将 CloudWatch 警报串到 Lambda,然后到 SSM 中的 AWS-RunRemoteScript?

我正在使用旧的 Adob​​e ColdFusion 堆栈(计划使用更现代的东西重新开发),我们遇到了一个问题,即 CPU 偶尔会出现峰值,我们需要在 Windows EC2 主机上重新启动 ColdFusion 和 IIS。

我有一些 CloudWatch 警报,它们触发了我发现并适用于发送 Slack 通知的 lambda 函数。如果我在附近,或者开发人员(我非常喜欢操作,但随着时间的推移试图了解更多开发内容),我们中的一个人将跳上服务器并重新启动服务,收集日志,然后开发人员可以使用它来尝试缩小它发生的原因。

我想要的是另一个警报,它可能在第一个警报后 15 分钟触发,以调用 SSM 中的 AWS-RunRemoteScript 文档,该文档运行存储在 S3 中的 powershell 脚本,它只是以正确的顺序停止和启动服务(重启不会t 工作 - 我发现我们需要停止 CF,停止 IIS,然后按该顺序将它们恢复)。

我已经将 Run Command 与 RunRemoteScript 一起使用,它很有效。我真正苦苦挣扎的是如何使 lambda 函数调用 SSM 并让它为我运行自动化。我搜索了高低,但我发现的少数资源对于我对编程的极其有限的掌握来说太复杂了。

请有人可以通过向我展示或指向一个资源来帮助我,该资源可以引导我创建一个 Lambda 脚本(最好是在 Python 中,因为我正在积极尝试学习它)来调用 SSM,并在其中调用 AWS 的 RunCommand- RunRemoteScript,如何插入参数(脚本位置等)并使其工作?

0 投票
1 回答
652 浏览

amazon-web-services - CloudWatch 重启警报操作未能执行

我正在尝试为 EC2 实例设置重启操作,参考以下指南。 https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/UsingAlarmActions.html#AddingRebootActions

警报工作正常并向给定的 SNS 主题发送电子邮件,但是,重新启动操作失败。以下是我看到的错误。

我的服务角色具有所有需要的权限集。

0 投票
1 回答
111 浏览

amazon-cloudwatch - 如何在 CloudWatch for Amazon Comprehend 上设置限制或警报

我计划将 Amazon Comprehend 用于一些试用项目,但我希望保持在免费套餐的限制范围内。出于这个原因,我需要在 CloudWatch 上设置一个警报,以便在我达到上述限制时得到通知。

但是,我无法从要监控的服务列表中选择“Amazon Comprehend”。

我能得到一些帮助吗?

0 投票
1 回答
110 浏览

amazon-web-services - 当 vpn 隧道启动或关闭时触发 sns

我正在尝试创建一个警报,当 vpn 隧道启动或关闭时触发 sns 主题。根据 AWS 的文档,我创建了 TunnelState 警报,该警报会在隧道关闭或条件达到 0 时触发。 在此处输入图像描述

现在,我想创建一个在隧道仅启动一次时触发的警报。有没有办法做到这一点?因为如果我创建一个条件,即在条件为 1 时触发 SNS 主题。当隧道启动时,它将保持警报状态。