问题标签 [grafana-alerts]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
elasticsearch - 如何在 Grafana 中查找内存使用差异
我在 grafana 的图形面板中工作,并使用弹性搜索作为数据源。在数据源中,我使用了带有时间戳的内存。我试图在差异超过 100 MB 时发出通知警报。如何查找第一天使用的内存与当天使用的内存之间的内存差异并发送警报通知?
prometheus - 如何在 Prometheus 警报管理器的分组查询中为每个时间序列创建单独的警报?
我正在使用 Prometheus alertmanager 对某些指标设置警报。其中一个指标是使用group by
查询,然后在该通用查询上设置警报。
示例:Grafana 仪表板上用于计算自上次成功训练模型以来的时间的指标:
此查询为每个model
名称与 匹配的时间序列创建一个单独的时间序列mymodel.*
。
model='mymodel.abc'
我想在这个指标上设置一个警报(使用 Prometheus alertmanager),只要特定模型(比如)超过警报设置的阈值,就会触发该警报。
现在,表达式是这样的:
但这只会在一个人model
超过阈值时触发一次,并且对于后续也超过阈值的人不会触发此警报models
(即,无论多个模型超过警报中设置的阈值,最多触发一次)。
我想为每个创建一个警报,model
并希望在模型数量超过阈值时触发警报。如何使用 alertmanager 中的模板来做到这一点?
grafana - Grafana 警报图标未显示在具有查看者角色的侧栏上
当用户具有查看者角色时,该用户是否应该能够查看警报列表。我不希望用户能够在那里编辑任何内容,但应该有查看权限吧?我目前使用的是 7.2.1,当用户具有查看角色时,他们无法在屏幕左侧看到警报图标。
kubernetes - pod 上的 Prometheus/Graphana 警报卡在挂起状态
我是运行 Prometheus 和 Graphana 的新手。我想创建一个警报,当 Kubernetes pod 处于挂起状态超过 15 分钟时触发。我正在使用的 PromQL 查询是:
kube_pod_status_phase{exported_namespace="mynamespace", phase="Pending"} > 0
我无法弄清楚的是如何根据 pod 处于该状态的时间来构建警报。我在 Graphana 中尝试了几种警报条件的排列方式:
WHEN avg() OF query (A, 15m, now) 大于 1
all 根据状态中的 pod 数量而不是持续时间触发警报。
如何根据状态时间构建警报?
求求你了,谢谢你
prometheus - Prometheus 增加功能警报
所以我的目标是为网络接口丢失设置警报机制。我正在使用node_network_receive_drop_total
哪个是计数器。我的目标是在发生滴滴时发出警报,这意味着滴滴计数何时增加。假设我在一段时间内有这些下降值。
在这个例子中,当差异不为零时,如何使用 Grafana 中的增加函数和警报条件来发出警报?
grafana - 在 Grafana 中创建警报 - 基于 2 个时间序列之间的增量
我在 InfluxDB 中实现了 2 个时间序列(A 和 B)并在 Grafana 中可视化。我想计算每个时间点的增量 D = A - B。如果 D>X (x = value threshold),则需要创建警报 I Grafana。我的问题是,如何最好地做到这一点?
grafana - 可以在grafana中加速时间吗?
其实我想做的,
我创建了仪表板来监控 grafana 中的警报状态。我在我的系统中创建了假数据来模拟我在这些板上的警报情况。该数据的时间涵盖了现在 - 现在 + 12 小时的范围。事实上,分析真实数据中的警报状态需要很长时间。出于这个原因,我的警报规则不能非常灵活。我必须等到这段时间结束才能看到系统中的警报状态。(实际上我有很多这样的状态。) Grafana 根据我数据库中的记录创建待处理、警报和 ok 状态。有没有一种方法可以快速验证我的测试而无需等待这个时间?
grafana - Grafana 的警报通知模板似乎不起作用
我已尝试按照此链接中的步骤操作,但我在警报消息中看到的是文本本身,即${Label}
,而不是该标签的值。我不使用模板变量。
我究竟做错了什么?
grafana-alerts - grafana 可以在警报通知的消息中包含当前时间戳吗?
我请求在该警报的电子邮件的消息正文中包含引发警报的时间。
我已经检查了创建警报和警报通知模板,看起来它可能是可能的,但我找不到任何对任何受支持变量列表的引用。
作为参考,我们使用 Grafana v7.4.0 (c2203b9859) 并根据 cloudwatch 指标查询创建警报:
REMOVE_EMPTY(SEARCH('{"AWS/ApiGateway","ApiName","Method","Resource","Stage"} MetricName="5XXError"', 'Sum', 60))
因此,我们可以使用的结果中没有任何内容,除非有人知道如何从其中一个数据表中提取最后一个时间戳;)
我想要做的是在触发此警报时发送的电子邮件中包含这样的内容(尽管实际的日期格式根本不重要):
警报于 2021-08-26T12:03 提出
谢谢