问题标签 [grafana-alerts]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
grafana - Grafana 仅针对少数相对时间范围过滤器显示“未找到数据”
嗨,我正在使用 Postgresql 作为数据库的 Grafana V7.0.0,当我选择今天/今年(过滤器与月/日/年)等时,数据显示正确。但是当我选择数据过滤器作为过去 6 小时/最后12 小时(过滤器与时间)显示为“无数据显示”。
注意:Grafana 时区仅显示正确的时间如果我选择 UTC,因此尝试以下 2 个解决方案,结果仍然相同。1. 将数据库和主机时间更改为 UTC 2. 将所有时间更改为 EDT,因为 em 从基于 EDT 时区的 splunk 中提取数据。
grafana - Grafana 警报 CloudWatch 数据源:tsdb.HandleRequest()
我正在使用来自 CloudWatch 数据源的指标在 Grafana 中设置警报。
我正在监控网络负载均衡器中的不健康主机。当不健康的主机数量增加时,警报触发正常,但是我在电子邮件和日志中看到以下错误:
tsdb.HandleRequest() error Invalid time range: Start time must be before end time
这是警报设置的屏幕截图:
我已经尝试调整各种间隔而错误没有改变。它必须在查询中为 now-1m,因为 NLB 每分钟只报告一次指标。
有什么想法可能是错的吗?
prometheus - 是否可以根据另一个警报是否触发有条件地向普罗米修斯发出警报?
这里的想法是我正在考虑对一个指标发出警报,该指标证实了另一个工具正在监控的指标。例如:我可能有一个服务通过提供队列来执行某些任务,当处理的任务降为零时,需要触发警报。另一项服务是监控队列何时没有缩小,基本上是从发送方检测请求没有被处理,然后它也需要触发。
但是,我想避免两个警报。过多的噪音会影响 MTTR。有没有办法可以避免第二个警报,加入警报,或者在单个警报中提及另一个警报。最后一个有点像将异常/错误包装在另一个异常/错误中,如果可能的话,也可能是我的首选方法。
是否可以根据另一个人是否在开火来有条件地向 Prometheus 发出警报?
twilio - 我应该使用哪些 Prometheus 函数在 Grafana 中设置关于总请求与成功请求之间比率的警报?
我正在使用 Twilio 发送 MFA SMS 以供用户登录。
当我要求 Twilio 为我发送 SMS 时,我还向它发送了一个回调 URL,当消息的状态发生更改时,Twilio 将发布它。message-status
在该回调端点中,我使用状态标签 ( )递增 Prometheus 计数器。可能的状态有:排队、已发送、已交付、失败和未交付,而“健康”状态转换为排队-->已发送-->已交付。
此外,每次我收到发送短信的请求时,我都会增加另一个简单的普罗米修斯计数器,根本没有标签(total-messages
)。
我在 Grafana 中查询了这些计数器:
我尝试对所有已传递消息与发送消息总数之间的比率设置警报:
我做了一些手动测试,图表看起来不像预期的那样;虽然我发送的所有消息都已成功传递,但我希望这两个指标之间的比率为 1,但事实并非如此 - 计数器 ( total-messages
) 更高。
现在,我确定所有消息都已实际传递:
- 查看我的 Twilio 帐户的仪表板
- 查看 pod 的日志(每次这些计数器之一递增时都会打印日志)
- 这些消息是针对我的私人电话的,我得到了它们。
我想我查询指标的方式是错误的:我试图删除“增加”函数,只保留 sum 函数。然后,我看到两个图表是相同的,正如预期的那样!
那么,当我使用增加时,我怎么可能看不到完全相同的图表呢?我究竟做错了什么?对于这种情况,我应该使用哪些 Prometheus 函数?有没有更方便的方法来设置此类指标的警报(针对成功请求的总请求数)?
谢谢!
docker - 未配置 SMTP,请检查您的 grafana.ini 配置文件的 [smtp] 部分
对于通知,我在 Grafana 中添加了通知通道,类型为电子邮件,然后单击“发送测试”按钮,但它给出了 -
我已将 Grafana 安装为 docker 容器,因此我进入容器并grafana.ini
使用 SMTP 详细信息更新文件并反映更改,重新启动 Grafana 并使用 -
现在转到通知频道并单击“发送测试”,但仍然看到相同的错误。
请帮助了解这里可能出了什么问题以及哪个日志文件(带有 location )来检查这里到底出了什么问题。
prometheus - Grafana 警报/值为零
我有普罗米修斯查询=sum by (job) (rate(http_requests_total[5m]))
你能告诉我如何在 grafana 中创建警报当值等于零(长于给定时间)
我找不到合适的功能
grafana - 从 Grafana 中的图形禁用查看、共享和更多菜单
如何从 Grafana [Panel Menu --> View, Share, More–Export CSV, JSON etc;] 禁用查看、共享和更多菜单。我不想向用户显示这些选项。