“cloudwatch-alarms”的相关标签问题

0 投票

1 回答

447 浏览

amazon-web-services - AWS Cloudwatch - 在 15 分钟的 lambda 超时时不发送警报邮件

我有一个奇怪的问题，我不明白。我创建了一个 cloudwatch 警报，它应该通知我 lambda 执行中的错误（包括超时）。

报警的相关参数如下：

当我的 lambda 在 15 分钟（最大 Lambda 执行时间）后超时时，不会向我发送任何电子邮件。当我的 lambda 在 2、6、10 或 14 分钟后超时时，我将按预期收到通知电子邮件。即使在 14 分 30 秒时，也会发送邮件。超过 14:30 分钟，指标不会切换到警报状态。

有人知道为什么会这样吗？数据点（错误）在指标中正确显示。似乎该点（错误）设置为 lambda 的开始日期。这可能是问题吗？因为自 lambda 开始以来已经过去了 3 个评估期？但是为什么我在 14 分钟后超时运行时收到警报邮件（也是一个以上的评估期）。

已经在AWS 论坛中问过这个问题，但还没有答案。

谁能建议我做错了什么？

问候汉内斯

2020-09-21T05:47:41.910

0 投票

1 回答

592 浏览

amazon-web-services - Terraform：将 SEARCH 表达式与 CloudWatch 警报结合使用

我已经查看了这个并没有太大帮助的问题，所以这里......

我有一堆 Lambda 函数，我想监控它们并在出现问题时触发 CloudWatch 警报。Lambda 函数实际上以环境名称为前缀，即env-1-function-1,env-1-function-2等env-2-function-1。

这些环境是独立的，即 env1 的 cloudwatch 警报设置不应该与 env2 有任何关系。所以为了实现这一点，我开始研究SEARCH表达式。

这是我的警报：

env_prefix会在哪里env-1。在绘制指标时，这在 AWS 控制台中工作得很好。

现在，当我运行 Terraform 时，“更新指标警报失败：ValidationError：Period 不能为空”这句话似乎有问题，但是根据关于此的 Terraform 文档，在提供时metric_query您可能没有指定期间...

我是否有一种具体的方法来限制每个环境（名称过滤器）过滤我的 Lambda 指标，而不是在整个账户中使用 Lambda 函数？

amazon-web-services aws-lambda terraform amazon-cloudwatch cloudwatch-alarms

2020-09-24T11:21:05.497

0 投票

1 回答

474 浏览

amazon-web-services - aws elastic beanstalk 无法创建扩展触发器失败，AWSEBCloudwatchAlarmHigh 不允许空值

当我尝试指定缩放触发器时，它会不断出错

我有一个保存的模板，我正在尝试添加

所以我在没有它的情况下创建了它，它创建了自动警报。我尝试使用浏览器更新到此设置，但也失败并显示消息

这是我保存的模板

我正在使用共享负载均衡器，这可能是问题吗？使用经典的负载均衡器，它可以正常工作 - 将自动缩放指标设置为使用延迟。

要从 cli 创建环境，我运行。

更新

所以我在 beanstalk 环境中找不到 TargetResponseTime。

amazon-web-services amazon-elastic-beanstalk cloudwatch-alarms

2020-09-28T11:35:32.420

0 投票

1 回答

146 浏览

amazon-web-services - 在 cloudwatch 中使用单个指标创建指标数学警报

我正在尝试在 cloudwatch 中创建警报。我有一个指标，我发出1.0表示成功，0.0表示失败。SUM统计数据应该给我所有成功的请求，而SAMPLE COUNT应该给所有请求（包括失败的请求）。我想创建一个警报，如果SUM(metric)/SAMPLE COUNT(metric) <= threshold它会发出警报。我无法使用单个指标来做同样的事情。SAMPLE COUNT 选项不显示。如果无法通过单个指标在 cloudwatch 中实现这一目标，我是否应该创建两个指标？

amazon-web-services amazon-cloudwatch cloudwatch-alarms

2020-10-07T09:59:21.233

0 投票

1 回答

541 浏览

amazon-web-services - 选择或汇总针对 Cloudwatch 数据代理指标记录的维度

我正在使用 Cloudwatch 数据代理的 Procstat 插件来记录一些每个进程的 CPU 使用情况。

https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch-Agent-procstat-process-metrics.html

这一切都被收集好了，但是该指标被记录为“实例 ID（例如 i-143...）”、“图像 ID（例如 ami-123...）”和“实例类型”（例如 t3.small )'

当服务器被缩小和缩小时，我的警报会因为实例 ID 发生变化而中断。我还更新了 AMI，并可能在某些时候更改实例类型。如果我正在处理实例 ID，则 AMI 和实例类型无论如何都会被修复。

有没有办法配置 Cloudwatch 数据代理来记录没有这些维度的指标，或者让 Cloudwatch 指标聚合所有实例 ID？

amazon-web-services amazon-cloudwatch cloudwatch-alarms

2020-10-13T09:45:34.723

0 投票

2 回答

193 浏览

amazon-web-services - 如果在 aws cloud watch 中空闲 30 分钟，如何停止我们的实例

我已经设置了 aws cloud watch

以下是我们云手表中设置的详细信息

指标名称：CPUUtilization
统计：平均
时间：5分钟
阈值类型：静态
每当 CPUUtilization 低于/等于 10 时
报警数据点：1 出 1
缺失数据处理：将缺失数据视为缺失

EC2 动作：

报警状态触发：In Alarm
执行以下操作：停止此实例

5 分钟后，我们的服务器仍然没有停止使用 aws 中的云手表。

amazon-web-services amazon-ec2 amazon-cloudwatch cloudwatch-alarms

2020-10-14T12:02:06.160

0 投票

1 回答

441 浏览

amazon-web-services - AWS Cloudwatch 警报不起作用：过去几天，警报保持“正常”，即使它超过阈值

我有一个警报，几个月来一直有效地管理我的 ASG 的大小。但是，从星期一（10 月 12 日）开始，它就停止了工作。即使图表清楚地显示它高于阈值，它也保持在“OK”状态。请参阅随附的屏幕截图。

可能会或可能不会相关的是警报将触发，然后失败且没有错误消息。在 ASG 的冷却阶段触发警报时，似乎会发生这种情况。一旦发生这种情况，警报将恢复为“OK”，然后无限期地停留在那里，即使它高于阈值。在星期一之前，它会一直处于警报状态，反复重新触发，直到 ASG 离开冷却状态。

有人知道这里发生了什么吗？我怎样才能解决这个问题？为什么在我这边没有变化的时候突然变了？

amazon-web-services amazon-cloudwatch cloudwatch-alarms

2020-10-15T16:56:51.240

0 投票

1 回答

239 浏览

amazon-web-services - 如果每天创建的文件少于 4 个，则需要为 AWS S3 存储桶发出警报

我有一些脚本每天在 AWS S3 存储桶中生成 4 个 csv 文件。我正在尝试使用 Cloudwatch 在 Amazon AWS 中创建一个警报，以查找在任何给定日期是否在该特定 S3 存储桶中生成的文件少于 4 个。我试图创建一个警报，但令人惊讶的是，警报具有 sum 和其他选项，但没有选项可以在给定的时间量（比如 24 小时）内检查特定的数字。

PS我在警报中看到了平均函数，但它没有给出桶中创建的对象的每日平均值。

是否可以以我需要的方式创建警报？我试过谷歌搜索，但没有找到解决这个问题的确切方法。

amazon-web-services amazon-s3 cloudwatch-alarms

2020-10-20T09:49:39.057

0 投票

2 回答

400 浏览