问题标签 [promql]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
prometheus - 所有可用指标的 Prometheus 端点
我很好奇普罗米修斯的工作原理。使用 Prometheus 界面,我可以看到一个下拉列表,我认为它包含所有可用的指标。但是,我无法访问列出所有已抓取指标的指标端点。http://targethost:9090/metrics
端点仅显示有关 Prometheus 服务器本身的指标。是否可以访问列出所有可用指标的类似端点。我可以基于执行查询,{__name__=~".+"}
但我宁愿避免使用此选项。也许我还应该补充一点,访问目标部分中列出的端点对我不起作用,因为“无法建立连接”。
prometheus - Prometheus 查询检测结果
这个问题也被问到了这个问题:https ://github.com/prometheus/prometheus/issues/3264 。但我没有看到它被直接回答。我想知道是否有任何方法可以检测 PromQL 查询的输出是否为
prometheus - PromQL:查找低于平均水平的向量元素
我有一个etcd_network_client_grpc_received_bytes_total
带有标签 ( ) 的 Prometheus 向量度量 ( instance
)。对于一组标签值中的每一个,该度量都有不同的值(即每个值一个值instance
)。我想找到instance
值小于所有实例平均值的 70% 的所有 s。
例如,如果向量具有以下值:
...那么查询应该返回第 2、第 4 和第 5 个元素。
什么不起作用:
(我猜是因为对每个标签值都进行了评估)
这可能吗?
(我实际上应该比较费率,而不是总数,但现在让我们保持简单)
grafana - 在 Grafana Prometheus 中添加静态时间间隔面板
我正在尝试添加一个静态面板以显示 grafana prometheus 中本年度的请求总数
我正在使用 sum(http_server_requests_seconds_count{}) 作为 grafana 中的当前间隔选择
我有什么办法可以在本年度做到这一点
kubernetes - Prometheus 与 Kubernetes v1.16 不兼容
我安装了 stable/prometheus helm chart,并在helm/charts#17268中提出了一些小的更改,以使其与 Kubernetes v1.16 兼容
安装后,Kubernetes grafana 仪表板都没有显示正确的值。我正在使用 8769 ( https://grafana.com/grafana/dashboards/8769 ) 仪表板,它提供有关 cpu、内存、网络等的许多信息。此仪表板在较旧的 k8s 版本上正常工作,但在 v1.16 上显示没有结果。我还随机尝试了其他一些仪表板(8588、6879、10551),但它们要么只显示每个 pod 的请求资源,而不是实时使用情况,要么什么也不显示。
这些仪表板所做的是将 promql 查询发送到 prometheus 并获取结果。例如,这是来自 8769 仪表板的 cpu 使用情况的 promql 查询:
我不知道我是否必须更改 promql 或问题出在其他地方。
kubernetes - 用于获取集群范围内的命名空间 CPU 使用情况的 PromQL 查询
我在不同的命名空间中运行我们应用程序的不同版本,并且我已经设置了一个 prometheus 和 grafana 堆栈来监控它们。我使用下面的 promql 来获取不同 pod 的 cpu 使用率(占 1 个核心的百分比),它返回的值与我从以下位置获得的值匹配kubectl top pods -n namespace
:
问题是我想获取命名空间集群范围内所有 pod 的总 cpu 使用率,我尝试了不同的查询,但它们返回的值与我从上述 promql 或kubectl top pods -n namespace
.
我尝试过的 promql 查询:
我正在Singlestat
为此使用,并且在visualization
从Value
部分中我尝试了不同的show
方法,例如平均,总计,当前但未返回正确的值。
我的问题是如何获得命名空间集群范围内所有 pod 的总 cpu 使用率?
kubernetes - 按服务对指标进行排序?
我需要为一个位于同样大的 K8S 集群上的大型应用程序设置监控。由于这个应用程序和相应的基础设施是如何设置的,我需要能够根据服务(在 K8S 中)监控 pod。
我通常会做类似的事情:
但这不会返回任何东西。有人会有更好的方法吗?
prometheus - PromQL - 计算指标具有相同值的次数
是否有任何功能可以显示特定指标在 Prometheus 上具有相同值的次数?
我有一个不断返回整数 1024 的指标:exec_nsa_server_brokers_on_KM
当出现问题时,该值可能是 1023 甚至 1022。我想要实现的是有一个查询,该查询返回该指标返回 1024 或 1023 的次数。
我尝试了一些计数功能,但看起来它们适用于不同的场景。
elasticsearch - 在 Prometheus 警报规则的标签值中使用今天的日期
我是 Prometheus 和警报的新手,我无法通过查看文档来完善我的答案。
我有一些数据将进入弹性搜索集群。每天,该进程都会在elasticsearch 上创建一个新索引,并将当天的数据写入该索引(例如,、、my_index-2019-10-06
... my_index-2019-10-05
)。我想监视今天索引的大小并查看它是否在增长,如果它没有在定义的时间间隔(例如 15 分钟)内增长,我想在 Prometheus 中发出警报。为此,我正在考虑这样一个expr
警报规则:
应该是动态的TODAY-DATE
,并且每天都会生成。但据我了解,标签值中不能有动态值,也不能有获取日期的函数。然后我在考虑比较所有索引的大小总和的增量以 开头my_index
,但是这种方法的问题是保留时间,如果删除一个索引,总和的增量可能是负数,而新的数据即将进入今日指数。你有解决这个问题的方法吗?
提前致谢。