问题标签 [cloudwatch-alarms]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
amazon-cloudwatch - 为 AWS Fargate 设置 Cloudwatch 警报上限和下限阈值
我创建了一个自动缩放目标和一个附加到它的策略。
这将创建 cloudwatch 警报:
高的: 3 datapoints within 3 minutes
低的: 15 datapoints within 15 minutes
我想将其自定义为:
高的: 1 datapoint within 1 minute
低的: 1 datapoint within 1 minute
我可以从 AWS 控制台手动执行此操作。但是,正在努力寻找一种使用 cloudformation 模板执行相同操作的方法。
amazon-cloudwatch - 为什么 AWS CloudWatch 警报无法向加密的 SNS 主题发送通知?
如果我的 lambda 函数内存使用量超过 lambda 内存大小的 80%,我会设置警报来通知我。我正在使用自定义指标捕获数据点,并且当内存使用量超过阈值时,我能够在 cloudwatch 控制台中看到警报。但是,当 Alarm 采取操作向相应的 SNS 主题发送通知时失败并显示以下消息:
}
SNS 主题使用 KMS 密钥加密,我允许 cloudwatch 访问密钥策略中的密钥:
但行动仍然失败。我也尝试过events.amazonaws.com
担任校长,但没有运气。我很感激这方面的任何帮助。
boto3 - 为初始 AWS 应用程序自动扩展添加延迟
我正在使用 boto3 将自定义应用程序自动缩放策略应用于两个 HTTP 端点,这会增加每个端点的实例数。这些策略是根据单个队列的大小触发的。例如,两个端点都有警报,当队列大于 1000 时会触发扩展。目前,只要此警报变为高,两个端点就会开始扩展。
端点 #1 需要 3 分钟才能完成横向扩展,而端点 #2 需要 7 分钟才能完成横向扩展。问题是端点 #1 将数据发送到端点 #2,所以我需要端点 #2 在端点 #1 之前完成扩展。
因此,我正在尝试找到一种方法来为端点 #1 的 scale-out 添加时间延迟。看起来该scale_out_cooldown
参数仅在缩放事件之间添加了时间延迟,而不是在我想要的初始触发时。有没有办法将警报触发的初始横向扩展事件延迟设定的秒数?
amazon-web-services - 如何为 beanstalk 环境内存设置 cloudwatch 警报
我正在尝试为 AWS Elastic Beanstalk 环境的所有实例上的内存设置 Cloudwatch 警报。我已经使用以下教程设置了在 Cloudwatch 上获取内存使用情况的功能:
https://docs.aws.amazon.com/elasticbeanstalk/latest/dg/customize-containers-cw.html
现在我想设置一个警报,如果任何这些实例的 MemoryUtilization 超过某个阈值,就会触发该警报。我可以选择所有并分别设置警报,但我想确保即使 Beanstalk 扩展集群或交换实例,也不必重新配置警报。
有没有一种方法可以为实例名称 =“env-name”且指标为 MemoryUtilization 的情况设置警报?
amazon-web-services - 在 Lambda 函数上设置持续时间警报的最佳值
我有一个可以做一些工作的 lambda 函数。我想在 lambda 的持续时间内在其上创建一个 cloudwatch 警报,即这个 lambda 运行需要多少时间?
我尝试对警报使用以下值,但我遇到了这个警报的问题,可能是由于冷启动问题。以下是我设置的值:
我面临的问题是,由于冷启动问题,它一直处于警报状态,可能是因为它不经常被调用。
为 lambda 设置的最佳值是多少?其他人如何在 lambda 上设置警报?
另外,如果 lambda 没有被调用多少时间,那么它会被关闭并且会出现冷启动问题?
amazon-web-services - AWS CloudWatch 触发时自动重置 (OK) 警报
我正在部署一个 AutoScalingGroup,其中 AutoScalingPolicies (ScaleUp & ScaleDown) 由 CloudWatch Alarm 触发(CPU > 70%, CPU < 10%)
。
AutoScaling 运行良好,但是...一旦 AutoScalingGroup 达到最小实例数 (2),CPU < 10%
警报会持续ALARM STATE
数小时...天...而不会重置为OK STATE
.
因为 CPU 利用率保持在 10% 以下,所以我知道警报永远不会回到OK STATE
.
我知道它的存在AlarmActions
类似于:
arn:aws:automate:${AWS::Region}:ec2:recover
(对于 EC2)
我搜索了类似的 Cloudwatch 操作,没有找到任何东西。
我有一个自定义解决方案:使用 Lambda 更改Alarm State to OK
但我想知道是否存在更智能/更简单的解决方案。
有人知道该怎么做吗?
谢谢。
amazon-web-services - 绝对初学者在哪里可以学习将 CloudWatch 警报串到 Lambda,然后到 SSM 中的 AWS-RunRemoteScript?
我正在使用旧的 Adobe ColdFusion 堆栈(计划使用更现代的东西重新开发),我们遇到了一个问题,即 CPU 偶尔会出现峰值,我们需要在 Windows EC2 主机上重新启动 ColdFusion 和 IIS。
我有一些 CloudWatch 警报,它们触发了我发现并适用于发送 Slack 通知的 lambda 函数。如果我在附近,或者开发人员(我非常喜欢操作,但随着时间的推移试图了解更多开发内容),我们中的一个人将跳上服务器并重新启动服务,收集日志,然后开发人员可以使用它来尝试缩小它发生的原因。
我想要的是另一个警报,它可能在第一个警报后 15 分钟触发,以调用 SSM 中的 AWS-RunRemoteScript 文档,该文档运行存储在 S3 中的 powershell 脚本,它只是以正确的顺序停止和启动服务(重启不会t 工作 - 我发现我们需要停止 CF,停止 IIS,然后按该顺序将它们恢复)。
我已经将 Run Command 与 RunRemoteScript 一起使用,它很有效。我真正苦苦挣扎的是如何使 lambda 函数调用 SSM 并让它为我运行自动化。我搜索了高低,但我发现的少数资源对于我对编程的极其有限的掌握来说太复杂了。
请有人可以通过向我展示或指向一个资源来帮助我,该资源可以引导我创建一个 Lambda 脚本(最好是在 Python 中,因为我正在积极尝试学习它)来调用 SSM,并在其中调用 AWS 的 RunCommand- RunRemoteScript,如何插入参数(脚本位置等)并使其工作?
amazon-web-services - CloudWatch 重启警报操作未能执行
我正在尝试为 EC2 实例设置重启操作,参考以下指南。 https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/UsingAlarmActions.html#AddingRebootActions
警报工作正常并向给定的 SNS 主题发送电子邮件,但是,重新启动操作失败。以下是我看到的错误。
我的服务角色具有所有需要的权限集。
amazon-cloudwatch - 如何在 CloudWatch for Amazon Comprehend 上设置限制或警报
我计划将 Amazon Comprehend 用于一些试用项目,但我希望保持在免费套餐的限制范围内。出于这个原因,我需要在 CloudWatch 上设置一个警报,以便在我达到上述限制时得到通知。
但是,我无法从要监控的服务列表中选择“Amazon Comprehend”。
我能得到一些帮助吗?