问题标签 [grafana-alerts]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
grafana - Grafana - 显示连接到特定频道的所有警报
我们有一个 Grafana,我的整个公司都在使用它。我想找到所有带有警报并通知我的团队的图表。我知道什么是通知渠道,但我不知道如何找到图表。
grafana - 我们可以从 grafana 中的 2 个不同数据源创建警报吗?
我们能否在 Grafana 中从 2 个图表(2 个数据源)创建警报并比较这些图表中的值。
例如:我在 1 个数据源中有一个参数,在另一个数据源中有一个参数,我为它们创建了一个图表。我可以创建一个警报来比较这两个属于 2 个不同数据源的查询(A 和 B),例如 ((AB)=0)
grafana - 我们可以在单一统计数据上创建警报吗
我们可以在单一数据上创建警报吗?我没有看到用于创建警报的“警报选项卡”。您能否建议我一种方法来比较来自 2 个数据源的两个单统计数据。
kubernetes - Grafana 警报以特定间隔摆动
我为我的 prometheus 数据创建了一个警报,该警报每 30 秒摆动一次,这是我设置检查的指定间隔。我正在尝试检查所需的 pod 数量是否在整个 15 分钟内不等于我的 k8s 集群中可用的 pod 数量。警报似乎表明我指定的指标是上次警报时的值,但如果我单击“测试警报”,返回的 json 指定现在不应该有警报。我不确定为什么会这样,任何见解都将不胜感激。以下是相关信息:
警报查询:(sum(kube_deployment_spec_replicas{namespace="default"}) without (deployment, instance, pod)) - (sum(kube_deployment_status_replicas_available{namespace="default"}) without (deployment, instance, pod))
条件:WHEN min() OF query(G,15m,now) IS ABOVE 0.5
如果没有数据或所有值都为空,则将状态设置为 Ok
如果执行错误或超时设置状态保持最后状态
编辑:当我直接对 prometheus 运行查询时,我得到以下响应:
curl -k -s 'https://prometheus-k8s/api/v1/query?query=(sum(kube_deployment_spec_replicas%7Bnamespace%3D%22default%22%7D)%20without%20(deployment%2C%20instance%2C%20pod))%20-%20(sum(kube_deployment_status_replicas_available%7Bnamespace%3D%22default%22%7D)%20without%20(deployment%2C%20instance%2C%20pod))'
{"status":"success","data":{"resultType":"vector","result":[{"metric":{"endpoint":"https-main","job":"kube-state-metrics","namespace":"default","service":"kube-state-metrics"},"value":[1529946877.247,"0"]}]}}%
grafana - Grafana:警报查询中不支持模板变量
嗨,我想在 grafana 中创建一个简单的警报,以检查过去 5 分钟内是否没有数据。
但我得到一个错误
警报查询中不支持模板变量
好吧,根据这个问题,grafana 中尚不支持模板。我有两个问题:
什么是模板?
我怎样才能避免这个错误?
cassandra - 为什么我没有在 grafana 中获得所有 cassandra 指标?
我们正在使用 Apache Cassandra(不是 datastax 版本)数据库。出于监控目的,我们使用 jolokia 的 REST API 来检索 cassandra 指标。
所有 jolokia API 都运行良好,这意味着我可以使用 jolokia 的其余 API 获取所有指标。我们也在使用 telegraf,telegraf 从 jolokia 收集指标并将它们转发到 InfluxDB。
但是,当我在 grafana 中使用 'telegraf' db 添加 influxdb 连接时,grafana 并没有向我显示所有指标(仅显示 5-6 个指标)。
我可以通过返回 cassandra 指标的 JSON 响应的 rest 客户端调用所有 jolokia API,但通过 grafana 我只能看到几个指标。
我需要在 Telegraf 的配置中进行哪些更改才能获取 grafana 中的所有指标?而且我还需要设置警报,例如如果 cassandra 中的每秒写入速率超过 1k,那么它应该通过邮件通知我。那么我该怎么做呢?
提前致谢?
grafana-alerts - 当数据在 x 分钟内没有变化时发出 Grafana 警报
一直在网上和论坛上翻滚,找不到这方面的资源。
我要实现的是在一段时间内数据没有变化时创建警报。
我们正在监控我们的网络服务器的打开文件,所以这个数字经常波动。请注意,当数字停滞不前时,它指向服务器上的问题。所以我们想要的是如果 openfile 保持 X 2 分钟提醒我们。
grafana - grafana 中警报指标中硬编码参数的替代方案
我正在尝试使用 grafana 和 prometheus 实现警报。
由于 Grafana 不允许在警报中使用指标中的模板变量,因此如果我想收集内存指标,我目前被迫对 IP 进行硬编码。
但这不是一个持久的解决方案,因为我的设置中的节点可以终止并在启用自动缩放时重新创建。
有没有比在指标中硬编码每个实例 IP 并仍然启用每个节点的内存使用警报更好的选择?
任何帮助将不胜感激。