问题标签 [promql]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
3300 浏览

prometheus - Prometheus 查询和 API 调用

我可以直接从 Prometheus UI 搜索查询,它工作正常:

K_MacInfo{macAddr="B0:11:12:FD:D1:A8"} offset 5m.

但是,当我尝试使用 curl 命令直接在服务器中运行它时,我发现语法错误并收到错误消息。

也不知道如何在这里添加偏移部分。你能指导我理解我在这里做错了什么吗?

0 投票
1 回答
2125 浏览

prometheus - 速率函数真的在普罗米修斯中给出平均值吗?

速率函数真的会随着时间的推移给出平均值吗?

我通过以下方式向端点发送 20 个请求

ab -n 20 http://0.0.0.0:8001/

快照

所以,我使用 rate 函数的指标超过 20 秒,所以它应该给我 1 个值,因为在过去 20 秒内有 20 个请求。

因此20 / 20 = 1,但它提供了值2

我相信结果的scrape_intervalevaluation_interval之间没有关系 ,我的两个间隔都是10s

0 投票
1 回答
4586 浏览

prometheus - Prometheus 中某些标签中的数据缺失时发出警报

我正在向 prometheus 发送与两个磁盘相关的数据。我想提醒一个磁盘的指标是否停止发送指标。假设我有 diskA 和 diskB,我正在收集 disk_up 指标。现在diskB失败了。在普罗米修斯

disk_up{disk="diskA"}会有数据并且 disk_up{disk="diskB"}会丢失

absent(disk_up)将为 0,因为 disk_up 有 diskA 的数据。 absent(disk_up{disk="diskB"})将达到目的。但我不想硬编码磁盘名称。

我能知道哪种方法是为这种情况设置警报的更好方法吗?

0 投票
1 回答
1500 浏览

prometheus - 如何在promql中的count_values之后过滤标签名称

在此处输入图像描述

一个名为 bag_status 的仪表,带有标签(a)

使用

它将计算不同值的数字

我想过滤值为 <1 的 bag_status

不工作

0 投票
1 回答
7149 浏览

prometheus - PromQL。如何添加来自不同指标的标签值

如果我有两个指标:

我想为重启指标设置警报,但包含cluster_name标签。我可以以某种方式汇总来自不同指标的标签值吗?

例如警报:

需要以某种方式在megatron此处添加 ^,以便警报管理器在发送通知时能够使用此标签

0 投票
1 回答
1637 浏览

kubernetes - Kubernetes:比较 Prometheus / PromQL 中 Pod 的 RSS 内存使用和 Pod 内存需求

我们有一个container_memory_rss来自 cadvisor 的指标和一个kube_pod_container_resource_requests_memory_bytes来自 Kubernetes 本身的指标。

是否可以将指标相互连接,以便我们可以直接比较两个指标的比率?更具体地说,我想基本上“加入”以下指标:

“加入”将在 pod 名称和命名空间上。

鉴于标签名称不同,PromQL 可以做到这一点吗?

0 投票
1 回答
289 浏览

promql - 如何编写 PromQL 单元测试来检查警报是否未触发?

我开始使用promtool test rules. 基本测试有效,但我还想编写测试来检查警报是否没有针对特定系列的值触发。

这可能吗?我将如何表达这样的测试?

0 投票
1 回答
2122 浏览

prometheus - 普罗米修斯计数和总和指标超过 pushgateway 的重启

我想计算用户在前端打开对话框并将结果发送到 prometheus pushgateway 的频率。

问题是,一旦网关重新启动,指标就消失了,我无法正确地对这些值求和。

在此处输入图像描述

速率函数似乎不适合这个目的。

无论在哪里重新启动,是否有可能随着时间的推移求和?

这是总和查询,但未显示我的期望。 在此处输入图像描述

如果我将它们分组,也许 sum_over_time 可以做到,但如果我添加 by 子句,它会引发错误。

在此处输入图像描述

0 投票
2 回答
17467 浏览

kubernetes - Prometheus 查询以获取 kubernetes pod 中的 CPU 和内存使用情况

我需要使用普罗米修斯查询来获取 kubernetes pod 中的 CPU 和内存使用情况。有人可以帮忙吗?

0 投票
1 回答
413 浏览

grafana - 具有相关字段但标签不同的 promql 示例

我正在使用 Prometheus 和 Grafana,并且正在尝试跟踪 Web 服务器应用程序。

我想绘制特定查询的平均持续时间(以毫秒为单位)。我想我可以从下面的数据中到达那里,但我很挣扎。

我的两组价值观:

他们有不同的标签。为此,我只关心 path="/api/caption/v1/messages.json" 的位置。

我认为我需要使用速率、总和和“开”或“忽略”的组合,但我根本无法继续或忽略工作。

我可以通过以下方式获得分子(以秒为单位):

这会返回:

但是分母可以有不同的返回码,所以我必须将它们相加,我需要做一些忽略或打开或其他事情,但我还没有找到一个可以帮助我的例子,而且我真的很陌生。

任何人?