问题标签 [promql]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
14911 浏览

prometheus - 所有可用指标的 Prometheus 端点

我很好奇普罗米修斯的工作原理。使用 Prometheus 界面,我可以看到一个下拉列表,我认为它包含所有可用的指标。但是,我无法访问列出所有已抓取指标的指标端点。http://targethost:9090/metrics端点仅显示有关 Prometheus 服务器本身的指标。是否可以访问列出所有可用指标的类似端点。我可以基于执行查询,{__name__=~".+"}但我宁愿避免使用此选项。也许我还应该补充一点,访问目标部分中列出的端点对我不起作用,因为“无法建立连接”。

0 投票
0 回答
770 浏览

prometheus - Prometheus 查询检测结果

这个问题也被问到了这个问题:https ://github.com/prometheus/prometheus/issues/3264 。但我没有看到它被直接回答。我想知道是否有任何方法可以检测 PromQL 查询的输出是否为

0 投票
1 回答
224 浏览

prometheus - PromQL:查找低于平均水平的向量元素

我有一个etcd_network_client_grpc_received_bytes_total带有标签 ( ) 的 Prometheus 向量度量 ( instance)。对于一组标签值中的每一个,该度量都有不同的值(即每个值一个值instance)。我想找到instance值小于所有实例平均值的 70% 的所有 s。

例如,如果向量具有以下值:

...那么查询应该返回第 2、第 4 和第 5 个元素。

什么不起作用:

(我猜是因为对每个标签值都进行了评估)

这可能吗?

(我实际上应该比较费率,而不是总数,但现在让我们保持简单)

0 投票
1 回答
138 浏览

grafana - 在 Grafana Prometheus 中添加静态时间间隔面板

我正在尝试添加一个静态面板以显示 grafana prometheus 中本年度的请求总数

我正在使用 sum(http_server_requests_seconds_count{}) 作为 grafana 中的当前间隔选择

我有什么办法可以在本年度做到这一点

0 投票
2 回答
1059 浏览

kubernetes - Prometheus 与 Kubernetes v1.16 不兼容

我安装了 stable/prometheus helm chart,并在helm/charts#17268中提出了一些小的更改,以使其与 Kubernetes v1.16 兼容

安装后,Kubernetes grafana 仪表板都没有显示正确的值。我正在使用 8769 ( https://grafana.com/grafana/dashboards/8769 ) 仪表板,它提供有关 cpu、内存、网络等的许多信息。此仪表板在较旧的 k8s 版本上正常工作,但在 v1.16 上显示没有结果。我还随机尝试了其他一些仪表板(8588、6879、10551),但它们要么只显示每个 pod 的请求资源,而不是实时使用情况,要么什么也不显示。

这些仪表板所做的是将 promql 查询发送到 prometheus 并获取结果。例如,这是来自 8769 仪表板的 cpu 使用情况的 promql 查询:

我不知道我是否必须更改 promql 或问题出在其他地方。

0 投票
1 回答
2719 浏览

kubernetes - 用于获取集群范围内的命名空间 CPU 使用情况的 PromQL 查询

我在不同的命名空间中运行我们应用程序的不同版本,并且我已经设置了一个 prometheus 和 grafana 堆栈来监控它们。我使用下面的 promql 来获取不同 pod 的 cpu 使用率(占 1 个核心的百分比),它返回的值与我从以下位置获得的值匹配kubectl top pods -n namespace

问题是我想获取命名空间集群范围内所有 pod 的总 cpu 使用率,我尝试了不同的查询,但它们返回的值与我从上述 promql 或kubectl top pods -n namespace.

我尝试过的 promql 查询:

我正在Singlestat为此使用,并且在visualizationValue部分中我尝试了不同的show方法,例如平均,总计,当前但未返回正确的值。

我的问题是如何获得命名空间集群范围内所有 pod 的总 cpu 使用率?

0 投票
1 回答
3115 浏览

grafana - 每分钟 PromQL 请求数

我正在尝试在图表中创建POST每分钟总请求数的图表,但是这种“加速”模式让我相信我没有得到每分钟的实际请求总数,而是得到一个累积值。

这是我的查询:

以下是 7 天内的“加速”模式(下降表示重新启动): 在此处输入图像描述

让我相信我的理解sum_over_time()不正确的是因为现有的 webhook 应该始终存在。在最近一次重新启动时,我们有 72k 的 webhook 订阅,因此价值随着时间的推移而攀升是没有意义的,在开始时看到一个大的峰值来捕获未捕获的 webhook 会更有意义在停机期间。

这个查询对于我想要实现的目标是否正确?

我正在使用 django-prometheus 进行导出。

0 投票
0 回答
126 浏览

kubernetes - 按服务对指标进行排序?

我需要为一个位于同样大的 K8S 集群上的大型应用程序设置监控。由于这个应用程序和相应的基础设施是如何设置的,我需要能够根据服务(在 K8S 中)监控 pod。

我通常会做类似的事情:

但这不会返回任何东西。有人会有更好的方法吗?

0 投票
1 回答
1659 浏览

prometheus - PromQL - 计算指标具有相同值的次数

是否有任何功能可以显示特定指标在 Prometheus 上具有相同值的次数?

我有一个不断返回整数 1024 的指标:exec_nsa_server_brokers_on_KM

当出现问题时,该值可能是 1023 甚至 1022。我想要实现的是有一个查询,该查询返回该指标返回 1024 或 1023 的次数。

我尝试了一些计数功能,但看起来它们适用于不同的场景。

0 投票
2 回答
3397 浏览

elasticsearch - 在 Prometheus 警报规则的标签值中使用今天的日期

我是 Prometheus 和警报的新手,我无法通过查看文档来完善我的答案。

我有一些数据将进入弹性搜索集群。每天,该进程都会在elasticsearch 上创建一个新索引,并将当天的数据写入该索引(例如,、、my_index-2019-10-06... my_index-2019-10-05)。我想监视今天索引的大小并查看它是否在增长,如果它没有在定义的时间间隔(例如 15 分钟)内增长,我想在 Prometheus 中发出警报。为此,我正在考虑这样一个expr警报规则:

应该是动态的TODAY-DATE,并且每天都会生成。但据我了解,标签值中不能有动态值,也不能有获取日期的函数。然后我在考虑比较所有索引的大小总和的增量以 开头my_index,但是这种方法的问题是保留时间,如果删除一个索引,总和的增量可能是负数,而新的数据即将进入今日指数。你有解决这个问题的方法吗?

提前致谢。