问题标签 [alertmanager]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
55 浏览

kubernetes - 使用所有 Prometheus 警报电子邮件发送通用“文本”

我在 Kubernetes 中安装了一个监控设置。我使用了 Prometheese,并且为了提醒我已经配置了警报管理器。一切正常。

我有一个发送通用文本的要求,例如:- 包含所有警报电子邮件的 wiki URL。我可以通过编辑所有警报块来做到这一点,但是有没有办法只添加这一行,以便在警报管理器发送电子邮件时将其接收?

这是警报管理器配置

0 投票
0 回答
9 浏览

alert - 有人知道如何在 TDengine 中添加警报规则吗?

TDengine 提供了一个名为 alert 的实用程序,通过 AlertManger 提供警报功能。

我很困惑如何添加多个警报规则?

我正在运行如下:

我添加了一些规则后,它会报告错误。

[root@bogon TDengine-alert]# cat alert.cfg { "port": 8100, "database": "file:alert.db", "tdengine": "root:root@/tcp(127.0.0.1:0) /", "log": { "level": "debug", "path": "" }, "receivers": { "alertManager": "http://127.0.0.1:9093/api/v1/alerts" , "控制台": true } }

[root@bogon ruite]# cat rule.json

[root@bogon ruite]# curl -d '@rule.json' http://localhost:8100/api/update-rule [root@bogon ruite]# curl http://localhost:8100/api/list-rule null [root@bogon ruite]#

0 投票
1 回答
53 浏览

alertmanager - 如何在普罗米修斯警报管理器的电子邮件通知中获取已解决的警报

我已经配置了我的普罗米修斯设置和普罗米修斯警报管理器,当警报解决时如何在电子邮件中获取已解决警报的通知目前仅警告特定的 cpu、内存、硬盘值超出但当值达到 OK 状态时,我需要在电子邮件中获得通知,这可能吗,任何解决此问题的线索

0 投票
1 回答
31 浏览

ubuntu - Alertmanager 服务未启动

我在 VM (ubuntu) 上配置了 Prometheus、node-exporter 和 alertmanager 以下视频:https ://www.youtube.com/watch?v=7gW5pSM6dlU

Prometheus 和 node-exporter 工作正常,但我无法启动 alertmanager。

但是 amtool 成功检查了我的配置文件:

我的 alertmanager 配置文件如下所示:

我的服务看起来像这样:

我不知道为什么它显示“权限被拒绝”,因为我用 sudo 开始服务。有任何想法吗?

0 投票
0 回答
87 浏览

prometheus - 如何使 Alertmanager 特定规则静音?

我收到有关服务器 CPU 负载增加的警报。每天,其中一个 jenkins 与构建一起引发警报。我想将它们静音,因为我非常清楚在这些构建期间负载很高。但是,我不想删除此警报。所以我通过alertmanager将警报设置为静音模式,但我每天仍然有30个没用的警报。

在此处输入图像描述

我不明白为什么沉默仍然有效。我是否必须制定禁止规则:

这样对吗?

谢谢

0 投票
1 回答
39 浏览

sms - 如何使用 prometheus/alertmanager 发送短信

我有两个无法解决的问题,因为我不知道我是否遗漏了一些东西..

这是我很有前途的配置,因此我想通过短信或推送接收警报,但它不起作用。

对于推倒部分,它通过我的 grafana 工作(但并非一直如此)。对于 http2sms,它始终通过浏览器运行。

但对于两者来说,它在警报管理器下都不起作用。而且我希望能够区分警报。例如,团队中的简单警告或电子邮件,并通过短信批评他们。我忘记安装什么了吗?

有没有人有可能看起来像这种需求的配置?谢谢

0 投票
0 回答
17 浏览

slack - 如何一一处理alertmanager警报

在用于松弛示例的 alertmanager 配置中,我通常会看到如下内容:

但这会将所有通知粘合在一个垃圾中,而不是一个一个地处理它们,因此每条消息都是一个单独的松弛通知。我怎样才能发送尽可能多的松弛消息,因为有警报?

此外,每条消息都应该转到它自己的通道,在警报的注释中定义,这样可能吗?:

range 只是将来自不同警报的字符串粘合到一大堆废话中,我希望它们分别处理

0 投票
0 回答
38 浏览

prometheus - 当 Alertmanager 通知 webhook 通道时,指标 alertmanager_cluster_messages_queued 计数递增

我在kubernetes中设置了prometheus、alertmanager(单集群)、pushgateway、webhook-service。

我在下面提到了配置的详细信息和日志,但我很抱歉这个大消息。

我是普罗米修斯工具的新手。 您能否帮我解释一下,为什么当 alertmanager 成功通知 webhook-service 警报时,alertmanager_cluster_messages_queued 指标值会不断增加?


Webhook 服务网址:http://webhook-svc:8085/event/webhook

有服务 service1、service2、service3 使用 pushgateway 每 1 分钟将指标推送到 prometheus,因为服务的工作周期很短。

有警报规则 - 基于以下条件触发的警报

  1. 如果过去 5 分钟没有指标值,则触发状态触发警报。
  2. 如果服务恢复并推送过去 5 分钟的指标值,则触发状态已解决的警报

警报规则有多个条件,因为我们想要稳定性过滤器,警报规则在下面的配置中提到,

以下是 prometheus 和 altermanager 的配置:

普罗米修斯配置图:

警报管理器配置图:

Alertmanager 收到来自 Prometheus 的警报并通知 webhook 服务。

Alertmanager 收到来自 Prometheus 日志的警报:

Webhook 服务收到警报日志:

Prometheus 服务器日志:

但是**alertmanager_cluster_messages_queued**每当警报被通知到 webhook 时,计数就会不断增加。alertmanager_cluster_messages_queued 的增加导致超出最大队列大小 (4096),因为在达到最大队列大小后,一些警报未发送到 webhook-service。

0 投票
0 回答
12 浏览

grafana - 如何从 Grafana 获取完整的日志错误消息到 Alertmanager 以进行警报?

我可以从 Grafana 上通过 alertmanager 发出警报的日志消息中获取标签。但是,我想将完整的日志消息放入发送到 slack 或电子邮件的警报消息中。有可能吗?我试过 .Labels.Message 和 .Labels.MessageTemplate 但它们不起作用。

0 投票
1 回答
23 浏览

kubernetes - 在特定时间点从 alertmanager 将所有触发警报同步到 webhook

由于 webhook 需要同步,尝试在特定时间点将所有触发警报重新发送到 webhook。Prometheus 和 alertmanager 部署在 gcp 中的 kubernetes 集群中。

任何想法如何做到这一点。repeat_intervall 仅在 12 小时后重新发送一个特定警报,但需要一次发送所有警报。

找到附加的我的警报管理器配置