问题标签 [grafana-alerts]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
azure - Grafana Alert/AzureMonitor:在 Grafana 中为图形创建警报规则时出现执行错误
描述:
我正在尝试在 grafana 中为图形(旧)创建警报规则,但出现执行错误。
格拉法纳配置:
- 数据源: Azure 监视器
- 仪表板: AKS 监视器容器
- Grafana作为 Docker 容器托管在Azure中
- 通知渠道: Microsoft Teams
警报规则配置:
错误:
工作状态:
- 配置的通知通道(类型:团队)正在完美触发。
- Grafana 运行良好
尝试场景:
- 删除并重新创建了运行 Grafana dokcer 映像的 WebApps 资源所在的整个 Grafana 资源组。
- 尝试从 Azure 市场添加 grafana。
- 在谷歌上搜索了很多关于这个错误但没有运气。
- 多次检查通知通道、Grafana(在 Azure 门户中)、警报规则的配置。
所以,如果有人知道这个错误,请告诉我解决方案。
(或者)
我错过了警报/通知的一些配置。如果是,请告诉我。
提前致谢!!
prometheus - Grafana 8 - 减少多个查询的警报
在 Grafana 8 中,可以分别减少每个系列的查询和警报:
导致这样的警报:
但是,在实际情况下,我需要监控 4 个不同的指标:
目前,我有 4 个警报规则,每个规则有 1 个查询。有没有办法,只有一个带有多个查询的警报规则,接收每个系列的状态(即每个实例)?
提前致谢。
grafana-alerts - 如何在 Grafana8 警报中设置升级通知策略
我试图弄清楚如何在新的 Grafana8 中配置警报以在一段时间后升级通知。我已经定义了两个级别的嵌套升级但失败并且通知仅发送到最后一个“第二级升级”。我希望它首先发送到“BO-Tools 团队”,然后发送到“第一级升级”,然后再发送到“第二级升级”,如果没有人纠正问题或之前取消警报,则中间有一段时间。
如何设置“组等待”、“组间隔”和“继续评估后续兄弟节点”等参数。
关于如何做的任何建议?不幸的是,我无法添加图片。
prometheus - 是否可以使用 Grafana 触发 Ansible Tower 剧本?
这更像是一个获取知识并选择我们是否正在寻求正确解决方案的问题。
我的应用程序通过 Grafana 和 Prometheus 进行监控。目前正在使用 Ansbile Tower 进行自我修复。所有基于应用程序性能的警报都通过 Grafana 仪表板进行管理。
我们知道想要将 Grafana 和 Ansible playbook 缝合在一起,以便 Grafana 中的警报可以触发 Ansible 中的 playbook。
我没有看到任何开箱即用的集成,但想知道是否有一种方法可以使用 Grafana 警报来实际调用 REST API 或在 Grafana 周围做任何事情来调用 Ansible 中的剧本。
谢谢你,阿尼什
grafana - grafana多维警报中如何创建无数据警报
我正在为一组 Windows 主机创建多维警报。目标是在主机不再报告时发出警报(无数据警报)。基于此文档,我可以过滤每个主机的指标,但是在设置警报条件时,在没有数据的情况下发出警报,即使主机没有报告,也不会发生任何事情。指标仅显示报告主机。任何想法?
sql - grafana 警报条件
我在 clickhouse 中有一些统计数据.. 导入到 grafana
我用下一个属性创建了一些警报:
grafana 向我发送通知:
但!最后一次计数是在 20 小时前!!!Grafana 必须送我 - 0// 请帮助
kubernetes - K8s 中针对 Pod 失败的警报
我想在 Grafana 中为我的 Kubernetes 集群创建警报。我已经在我的 k8s 集群中配置了 Prometheus、Node exporter、Kube-Metrics、Alert Manager。我想在不可调度或失败的 Pod 上设置警报。
- 无法调度或失败的 pod 的原因
- 一段时间后生成警报
- 创建另一个警报以在 pod 失败时通知我们。你能指导我如何实现这一目标吗?
prometheus - “智能” Grafana 警报 - 或 - Prometheus 中不相关目标的复合条件
概括
当特定的 PromQL 结果大于 0 并且另一个不相关的 PromQL 结果为 1 时,我想使用 Grafana 8+ 发出警报。
背景
我们有每天打开和关闭的设备。我想知道他们在这个操作窗口中何时关闭。我使用 probe_success 作为 PromQL 查询来了解设备何时关闭。我正在使用自定义 Prometheus 应用程序来了解设备何时打开和关闭 - 例如 PromQLpowerStatus{job="powerMonitor", section="1", zone="2" } == bool 1
尝试
考虑到部分和区域的电源状态,我已经查看了直接的 alertmanager/PromQL,但没有找到可以在我想要的时候工作的查询。我已经尝试了可以从 Grafana 8 警报文档中提取的所有内容,包括使用经典条件表达式,但似乎我只能想出一个解决方案,该解决方案依赖于在另一个不允许的经典条件中评估经典条件. 我认为这将是一个常见的用例,但我没有在网络上看到关于它的博客文章。
直觉
我有一种我没有看到的惯用方法来完成这个,有点像从命令式编程到声明式编程并想要循环遍历数据集:)。
你能帮我吗?