“cloudwatch-alarms”的相关标签问题

0 投票

2 回答

959 浏览

amazon-cloudwatch - 为 AWS Fargate 设置 Cloudwatch 警报上限和下限阈值

我创建了一个自动缩放目标和一个附加到它的策略。

这将创建 cloudwatch 警报：

高的： 3 datapoints within 3 minutes

低的： 15 datapoints within 15 minutes

我想将其自定义为：

高的： 1 datapoint within 1 minute

低的： 1 datapoint within 1 minute

我可以从 AWS 控制台手动执行此操作。但是，正在努力寻找一种使用 cloudformation 模板执行相同操作的方法。

2019-04-17T14:41:03.247

0 投票

1 回答

2628 浏览

amazon-cloudwatch - 为什么 AWS CloudWatch 警报无法向加密的 SNS 主题发送通知？

如果我的 lambda 函数内存使用量超过 lambda 内存大小的 80%，我会设置警报来通知我。我正在使用自定义指标捕获数据点，并且当内存使用量超过阈值时，我能够在 cloudwatch 控制台中看到警报。但是，当 Alarm 采取操作向相应的 SNS 主题发送通知时失败并显示以下消息：

}

SNS 主题使用 KMS 密钥加密，我允许 cloudwatch 访问密钥策略中的密钥：

但行动仍然失败。我也尝试过events.amazonaws.com担任校长，但没有运气。我很感激这方面的任何帮助。

amazon-cloudwatch aws-kms cloudwatch-alarms

2019-05-18T13:28:16.840

0 投票

1 回答

136 浏览

boto3 - 为初始 AWS 应用程序自动扩展添加延迟

我正在使用 boto3 将自定义应用程序自动缩放策略应用于两个 HTTP 端点，这会增加每个端点的实例数。这些策略是根据单个队列的大小触发的。例如，两个端点都有警报，当队列大于 1000 时会触发扩展。目前，只要此警报变为高，两个端点就会开始扩展。

端点 #1 需要 3 分钟才能完成横向扩展，而端点 #2 需要 7 分钟才能完成横向扩展。问题是端点 #1 将数据发送到端点 #2，所以我需要端点 #2 在端点 #1 之前完成扩展。

因此，我正在尝试找到一种方法来为端点 #1 的 scale-out 添加时间延迟。看起来该scale_out_cooldown参数仅在缩放事件之间添加了时间延迟，而不是在我想要的初始触发时。有没有办法将警报触发的初始横向扩展事件延迟设定的秒数？

boto3 amazon-cloudwatch autoscaling cloudwatch-alarms

2019-06-26T00:32:26.770

0 投票

3 回答

1327 浏览

amazon-web-services - 如何为 beanstalk 环境内存设置 cloudwatch 警报

我正在尝试为 AWS Elastic Beanstalk 环境的所有实例上的内存设置 Cloudwatch 警报。我已经使用以下教程设置了在 Cloudwatch 上获取内存使用情况的功能：

https://docs.aws.amazon.com/elasticbeanstalk/latest/dg/customize-containers-cw.html

现在我想设置一个警报，如果任何这些实例的 MemoryUtilization 超过某个阈值，就会触发该警报。我可以选择所有并分别设置警报，但我想确保即使 Beanstalk 扩展集群或交换实例，也不必重新配置警报。

有没有一种方法可以为实例名称 =“env-name”且指标为 MemoryUtilization 的情况设置警报？

amazon-web-services amazon-elastic-beanstalk amazon-cloudwatch cloudwatch-alarms

2019-07-02T20:09:50.197

0 投票

1 回答

476 浏览

amazon-web-services - 在 Lambda 函数上设置持续时间警报的最佳值

我有一个可以做一些工作的 lambda 函数。我想在 lambda 的持续时间内在其上创建一个 cloudwatch 警报，即这个 lambda 运行需要多少时间？

我尝试对警报使用以下值，但我遇到了这个警报的问题，可能是由于冷启动问题。以下是我设置的值：

我面临的问题是，由于冷启动问题，它一直处于警报状态，可能是因为它不经常被调用。

为 lambda 设置的最佳值是多少？其他人如何在 lambda 上设置警报？

另外，如果 lambda 没有被调用多少时间，那么它会被关闭并且会出现冷启动问题？

amazon-web-services aws-lambda amazon-cloudwatch cloudwatch-alarms

2019-07-06T06:12:37.837

0 投票

2 回答

3005 浏览

amazon-web-services - AWS CloudWatch 触发时自动重置 (OK) 警报

我正在部署一个 AutoScalingGroup，其中 AutoScalingPolicies (ScaleUp & ScaleDown) 由 CloudWatch Alarm 触发(CPU > 70%, CPU < 10%)。

AutoScaling 运行良好，但是...一旦 AutoScalingGroup 达到最小实例数 (2)，CPU < 10%警报会持续ALARM STATE数小时...天...而不会重置为OK STATE.

因为 CPU 利用率保持在 10% 以下，所以我知道警报永远不会回到OK STATE.

我知道它的存在AlarmActions类似于：

arn:aws:automate:${AWS::Region}:ec2:recover（对于 EC2）

我搜索了类似的 Cloudwatch 操作，没有找到任何东西。

我有一个自定义解决方案：使用 Lambda 更改Alarm State to OK但我想知道是否存在更智能/更简单的解决方案。

有人知道该怎么做吗？

谢谢。

amazon-web-services amazon-cloudwatch cloudwatch-alarms

2019-08-16T13:53:27.870

0 投票

0 回答

50 浏览

amazon-web-services - 绝对初学者在哪里可以学习将 CloudWatch 警报串到 Lambda，然后到 SSM 中的 AWS-RunRemoteScript？

我正在使用旧的 Adobe ColdFusion 堆栈（计划使用更现代的东西重新开发），我们遇到了一个问题，即 CPU 偶尔会出现峰值，我们需要在 Windows EC2 主机上重新启动 ColdFusion 和 IIS。

我有一些 CloudWatch 警报，它们触发了我发现并适用于发送 Slack 通知的 lambda 函数。如果我在附近，或者开发人员（我非常喜欢操作，但随着时间的推移试图了解更多开发内容），我们中的一个人将跳上服务器并重新启动服务，收集日志，然后开发人员可以使用它来尝试缩小它发生的原因。

我想要的是另一个警报，它可能在第一个警报后 15 分钟触发，以调用 SSM 中的 AWS-RunRemoteScript 文档，该文档运行存储在 S3 中的 powershell 脚本，它只是以正确的顺序停止和启动服务（重启不会t 工作 - 我发现我们需要停止 CF，停止 IIS，然后按该顺序将它们恢复）。

我已经将 Run Command 与 RunRemoteScript 一起使用，它很有效。我真正苦苦挣扎的是如何使 lambda 函数调用 SSM 并让它为我运行自动化。我搜索了高低，但我发现的少数资源对于我对编程的极其有限的掌握来说太复杂了。

请有人可以通过向我展示或指向一个资源来帮助我，该资源可以引导我创建一个 Lambda 脚本（最好是在 Python 中，因为我正在积极尝试学习它）来调用 SSM，并在其中调用 AWS 的 RunCommand- RunRemoteScript，如何插入参数（脚本位置等）并使其工作？

amazon-web-services amazon-ec2 aws-lambda ssm cloudwatch-alarms

2019-09-08T14:43:03.730

0 投票

1 回答

652 浏览