问题标签 [grafana-alerts]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
93 浏览

grafana - Grafana - 显示连接到特定频道的所有警报

我们有一个 Grafana,我的整个公司都在使用它。我想找到所有带有警报并通知我的团队的图表。我知道什么是通知渠道,但我不知道如何找到图表。

0 投票
1 回答
771 浏览

grafana - 我们可以从 grafana 中的 2 个不同数据源创建警报吗?

我们能否在 Grafana 中从 2 个图表(2 个数据源)创建警报并比较这些图表中的值。

例如:我在 1 个数据源中有一个参数,在另一个数据源中有一个参数,我为它们创建了一个图表。我可以创建一个警报来比较这两个属于 2 个不同数据源的查询(A 和 B),例如 ((AB)=0)

0 投票
1 回答
10073 浏览

grafana - 我们可以在单一统计数据上创建警报吗

我们可以在单一数据上创建警报吗?我没有看到用于创建警报的“警报选项卡”。您能否建议我一种方法来比较来自 2 个数据源的两个单统计数据。

0 投票
0 回答
517 浏览

kubernetes - Grafana 警报以特定间隔摆动

我为我的 prometheus 数据创建了一个警报,该警报每 30 秒摆动一次,这是我设置检查的指定间隔。我正在尝试检查所需的 pod 数量是否在整个 15 分钟内不等于我的 k8s 集群中可用的 pod 数量。警报似乎表明我指定的指标是上次警报时的值,但如果我单击“测试警报”,返回的 json 指定现在不应该有警报。我不确定为什么会这样,任何见解都将不胜感激。以下是相关信息:

警报查询:(sum(kube_deployment_spec_replicas{namespace="default"}) without (deployment, instance, pod)) - (sum(kube_deployment_status_replicas_available{namespace="default"}) without (deployment, instance, pod))

条件:WHEN min() OF query(G,15m,now) IS ABOVE 0.5

如果没有数据或所有值都为空,则将状态设置为 Ok

如果执行错误或超时设置状态保持最后状态

编辑:当我直接对 prometheus 运行查询时,我得到以下响应:

curl -k -s 'https://prometheus-k8s/api/v1/query?query=(sum(kube_deployment_spec_replicas%7Bnamespace%3D%22default%22%7D)%20without%20(deployment%2C%20instance%2C%20pod))%20-%20(sum(kube_deployment_status_replicas_available%7Bnamespace%3D%22default%22%7D)%20without%20(deployment%2C%20instance%2C%20pod))'

{"status":"success","data":{"resultType":"vector","result":[{"metric":{"endpoint":"https-main","job":"kube-state-metrics","namespace":"default","service":"kube-state-metrics"},"value":[1529946877.247,"0"]}]}}%

0 投票
4 回答
39331 浏览

grafana - Grafana:警报查询中不支持模板变量

嗨,我想在 grafana 中创建一个简单的警报,以检查过去 5 分钟内是否没有数据。

但我得到一个错误

警报查询中不支持模板变量

好吧,根据这个问题,grafana 中尚不支持模板。我有两个问题:

  1. 什么是模板?

  2. 我怎样才能避免这个错误?

在此处输入图像描述

0 投票
1 回答
318 浏览

grafana - Grafana - 如何对未下降的指标发出警报?

有没有办法在指标上配置 Grafana 警报以在指标值在一段时间内没有下降时触发?

我正在跟踪队列的大小,想知道它什么时候卡住了。

这是健康的: 在此处输入图像描述 这是不健康的: 在此处输入图像描述

0 投票
1 回答
463 浏览

cassandra - 为什么我没有在 grafana 中获得所有 cassandra 指标?

我们正在使用 Apache Cassandra(不是 datastax 版本)数据库。出于监控目的,我们使用 jolokia 的 REST API 来检索 cassandra 指标。

所有 jolokia API 都运行良好,这意味着我可以使用 jolokia 的其余 API 获取所有指标。我们也在使用 telegraf,telegraf 从 jolokia 收集指标并将它们转发到 InfluxDB。

但是,当我在 grafana 中使用 'telegraf' db 添加 influxdb 连接时,grafana 并没有向我显示所有指标(仅显示 5-6 个指标)。

我可以通过返回 cassandra 指标的 JSON 响应的 rest 客户端调用所有 jolokia API,但通过 grafana 我只能看到几个指标。

我需要在 Telegraf 的配置中进行哪些更改才能获取 grafana 中的所有指标?而且我还需要设置警报,例如如果 cassandra 中的每秒写入速率超过 1k,那么它应该通过邮件通知我。那么我该怎么做呢?

提前致谢?

0 投票
3 回答
4352 浏览

grafana-alerts - 当数据在 x 分钟内没有变化时发出 Grafana 警报

一直在网上和论坛上翻滚,找不到这方面的资源。

我要实现的是在一段时间内数据没有变化时创建警报。

我们正在监控我们的网络服务器的打开文件,所以这个数字经常波动。请注意,当数字停滞不前时,它指向服务器上的问题。所以我们想要的是如果 openfile 保持 X 2 分钟提醒我们。

0 投票
0 回答
833 浏览

grafana - Grafana 警报“连接:连接被拒绝”

我可以在 grafana 中创建仪表板,但是在尝试创建警报时,会出现连接被拒绝错误。Grafana 可以查询 influxdb,因为仪表板可以显示结果。我究竟做错了什么?

格拉法纳警报

0 投票
1 回答
268 浏览

grafana - grafana 中警报指标中硬编码参数的替代方案

我正在尝试使用 grafana 和 prometheus 实现警报。

由于 Grafana 不允许在警报中使用指标中的模板变量,因此如果我想收集内存指标,我目前被迫对 IP 进行硬编码。

但这不是一个持久的解决方案,因为我的设置中的节点可以终止并在启用自动缩放时重新创建。

有没有比在指标中硬编码每个实例 IP 并仍然启用每个节点的内存使用警报更好的选择?

任何帮助将不胜感激。