问题标签 [grafana-alerts]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
246 浏览

alert - 创建警报时获取对象的空值

嗨,我想在 grafana 中创建一个简单的警报。null在创建警报时获取对象的价值。

在此处输入图像描述

0 投票
0 回答
428 浏览

grafana - Grafana 仅针对少数相对时间范围过滤器显示“未找到数据”

嗨,我正在使用 Postgresql 作为数据库的 Grafana V7.0.0,当我选择今天/今年(过滤器与月/日/年)等时,数据显示正确。但是当我选择数据过滤器作为过去 6 小时/最后12 小时(过滤器与时间)显示为“无数据显示”。

注意:Grafana 时区仅显示正确的时间如果我选择 UTC,因此尝试以下 2 个解决方案,结果仍然相同。1. 将数据库和主机时间更改为 UTC 2. 将所有时间更改为 EDT,因为 em 从基于 EDT 时区的 splunk 中提取数据。

0 投票
0 回答
278 浏览

grafana - Grafana 警报 CloudWatch 数据源:tsdb.HandleRequest()

我正在使用来自 CloudWatch 数据源的指标在 Grafana 中设置警报。

我正在监控网络负载均衡器中的不健康主机。当不健康的主机数量增加时,警报触发正常,但是我在电子邮件和日志中看到以下错误:

tsdb.HandleRequest() error Invalid time range: Start time must be before end time

这是警报设置的屏幕截图: 警报设置[1]

我已经尝试调整各种间隔而错误没有改变。它必须在查询中为 now-1m,因为 NLB 每分钟只报告一次指标。

有什么想法可能是错的吗?

0 投票
1 回答
534 浏览

prometheus - 是否可以根据另一个警报是否触发有条件地向普罗米修斯发出警报?

这里的想法是我正在考虑对一个指标发出警报,该指标证实了另一个工具正在监控的指标。例如:我可能有一个服务通过提供队列来执行某些任务,当处理的任务降为零时,需要触发警报。另一项服务是监控队列何时没有缩小,基本上是从发送方检测请求没有被处理,然后它也需要触发。

但是,我想避免两个警报。过多的噪音会影响 MTTR。有没有办法可以避免第二个警报,加入警报,或者在单个警报中提及另一个警报。最后一个有点像将异常/错误包装在另一个异常/错误中,如果可能的话,也可能是我的首选方法。

是否可以根据另一个人是否在开火来有条件地向 Prometheus 发出警报?

0 投票
1 回答
950 浏览

grafana - 警报/Azure 监视器:“tsdb.HandleRequest() 响应错误 &{请求失败状态:400 错误请求 A 0xc001403600 [] [] []}”

我正在使用用于容器度量的 Azure Monitor 的 grafana 仪表板,但是在为 Kubernetes 集群中的 CPU 利用率创建警报时,我收到了上述错误。

这是 CPU 利用率的图表:

图像1

而且我还附上了我用来创建警报的条件:

img2

我不确定我在这里做错了什么。请指教!谢谢

0 投票
0 回答
131 浏览

twilio - 我应该使用哪些 Prometheus 函数在 Grafana 中设置关于总请求与成功请求之间比率的警报?

我正在使用 Twilio 发送 MFA SMS 以供用户登录。

当我要求 Twilio 为我发送 SMS 时,我还向它发送了一个回调 URL,当消息的状态发生更改时,Twilio 将发布它。message-status在该回调端点中,我使用状态标签 ( )递增 Prometheus 计数器。可能的状态有:排队、已发送、已交付、失败和未交付,而“健康”状态转换为排队-->已发送-->已交付。

此外,每次我收到发送短信的请求时,我都会增加另一个简单的普罗米修斯计数器,根本没有标签(total-messages)。

我在 Grafana 中查询了这些计数器:

我尝试对所有已传递消息与发送消息总数之间的比率设置警报:

我做了一些手动测试,图表看起来不像预期的那样;虽然我发送的所有消息都已成功传递,但我希望这两个指标之间的比率为 1,但事实并非如此 - 计数器 ( total-messages) 更高。

现在,我确定所有消息都已实际传递:

  1. 查看我的 Twilio 帐户的仪表板
  2. 查看 pod 的日志(每次这些计数器之一递增时都会打印日志)
  3. 这些消息是针对我的私人电话的,我得到了它们。

我想我查询指标的方式是错误的:我试图删除“增加”函数,只保留 sum 函数。然后,我看到两个图表是相同的,正如预期的那样!

那么,当我使用增加时,我怎么可能看不到完全相同的图表呢?我究竟做错了什么?对于这种情况,我应该使用哪些 Prometheus 函数?有没有更方便的方法来设置此类指标的警报(针对成功请求的总请求数)?

谢谢!

0 投票
2 回答
3008 浏览

docker - 未配置 SMTP,请检查您的 grafana.ini 配置文件的 [smtp] 部分

对于通知,我在 Grafana 中添加了通知通道,类型为电子邮件,然后单击“发送测试”按钮,但它给出了 -

我已将 Grafana 安装为 docker 容器,因此我进入容器并grafana.ini使用 SMTP 详细信息更新文件并反映更改,重新启动 Grafana 并使用 -

现在转到通知频道并单击“发送测试”,但仍然看到相同的错误。

请帮助了解这里可能出了什么问题以及哪个日志文件(带有 location )来检查这里到底出了什么问题。

0 投票
1 回答
737 浏览

prometheus - Grafana 警报/值为零

我有普罗米修斯查询=sum by (job) (rate(http_requests_total[5m]))

你能告诉我如何在 grafana 中创建警报当值等于零(长于给定时间)

我找不到合适的功能

0 投票
1 回答
262 浏览

grafana - 从 Grafana 中的图形禁用查看、共享和更多菜单

如何从 Grafana [Panel Menu --> View, Share, More–Export CSV, JSON etc;] 禁用查看、共享和更多菜单。我不想向用户显示这些选项。

0 投票
0 回答
928 浏览

kubernetes - 牧场主集群 kubernetes 上的插件 grafana “grafana-image-renderer”

我想在rancher中配置“rancher集群监控”的部分

使用插件 grafana “grafana-image-renderer”

但我有一个错误:我看到插件已成功安装,但之后我有一个错误。

rancher 集群监控部分