问题标签 [prometheus]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
5 回答
53023 浏览

prometheus - 最近的值或最后看到的值

Prometheus 是围绕返回指标的时间序列表示而构建的。然而,在许多情况下,我只关心指标现在的状态,我很难找到一种可靠的方法来获取指标的“最新”值。

因为现在它每 30 秒获取一次指标,所以我尝试了这样的方法:

但这感觉很脆弱。如果指标的日期在数据点之间超过或少于 30 秒,那么我要么得到一个以上的结果,要么得到零个结果。

如何获取指标的最新值?

0 投票
1 回答
1856 浏览

alert - 检查 prometheus 警报中每个节点的内存状态

我想为普罗米修斯写一个警报查询。如果任何节点消耗的内存超过特定的内存百分比,这将引发警报。

我想动态获取节点并检查它的内存状态。

  1. 读取所有节点

  2. 使用查询循环遍历每个节点

    sum(container_memory_usage_bytes{job="kubernetes-nodes", id="/", instance="$node"}) / sum(machine_memory_bytes{job="kubernetes-nodes", instance="$node"}) * 100

如果我提供节点的静态名称,此警报有效

我不想静态添加 ip,因为如果任何节点崩溃并使用不同的 ip 创建,k8s 节点 ip 可以在一段时间内更改

0 投票
3 回答
36656 浏览

elasticsearch - 普罗米修斯 vs ElasticSearch。哪个更适合容器和服务器监控?

ElasticSearch 是一个文档存储,更像是一个搜索引擎,我认为 ElasticSearch 不是监控高维数据的好选择,因为它消耗大量资源。另一方面,prometheus 是一个 TSDB,专为捕获高维数据而设计。

任何有这方面经验的人请告诉我什么是容器和服务器监控的最佳工具。

0 投票
2 回答
500 浏览

kubernetes - Prometheus 中的 Prometheus 嵌套警报查询

可以在普罗米修斯警报中添加嵌套查询吗?我正在使用 prometheus 来监控 kubernetes 集群。

如果节点已关闭,则会生成警报,但我想配置警报,以便如果任何节点已关闭,那么普罗米修斯不应该为在其上运行的 pod 和服务发送警报。

像这样的东西,

0 投票
1 回答
1953 浏览

spring-boot-actuator - 带有 Prometheus 的弹簧执行器,从不调用自定义 MetricWriter

我想为我的 Spring Boot 应用程序添加度量标准。指标将通过 grafana 显示。

我找到了关于将弹簧执行器与普罗米修斯集成的好文章

根据示例,我应该实现我的自定义MetricWriter 以更新相应的CounterGauge在 Prometheus 中CollectorRegistry 它看起来像这样:

其他 3 个必需元素是:PrometheusEndpointPrometheusMvcEndpointPrometheusEndpointContextConfiguration

毕竟,可以通过调用 ' http://localhost:8080/prometheus ' url 来查看收集到的指标。

结果应该是这样的:

但是,我收到一个空页面。这是用于收集一些指标的测试类。

PS:我注意到GaugeService有几个实现,在我的应用程序中这是DropwizardMetricServices. 这个实现已经包含它自己的指标注册表,它收集我的指标。因此,当我调用“/prometheus”端点时,我得到一个空页面,因为CollectorRegistry' in my customPrometheusMetricWriter 永远不会填充我的指标。

那么请告诉我如何解决这个问题?

0 投票
1 回答
545 浏览

prometheus - 多站点部署中基于推送的联合

我有一个类似设置的多数据中心,除了它们都部署在客户站点中,我无法进行基于拉取的联合以将所有站点的指标获取到一个集中的 Prometheus 设置中。这种设置的最佳架构是什么?

我无法看到我们如何推送网关,因为它需要各个应用程序将指标推送到中央推送网关服务器,从而跳过现场 Prometheus 服务器。有没有办法让现场 Prometheus 服务器将所有指标推送到推送网关?

桑托什

0 投票
3 回答
18111 浏览

python - 如何使用 Python 和 Prometheus Pushgateway 推送指标

我希望使用 Pushgateway 将多标签指标推送到 Prometheus。该文档提供了一个 curl 示例,但我需要通过 Python 发送它。此外,我想在指标中嵌入多个标签。

0 投票
1 回答
99 浏览

prometheus - Prometheus 没有显示 eclipse java 服务器为 up

我正在尝试使用 prometheus,为此这是我的 proetheus.yml 文件

我启动了node_exporter在端口 9100 上运行的服务,并在 eclipse 中启动了我的 java 服务器。但是普罗米修斯说节点作业已启动(1),而 my_job 未启动(0)。为什么会发生这种情况?任何帮助,将不胜感激。谢谢 !!

0 投票
2 回答
5838 浏览

time - 在 Prometheus 警报管理器电子邮件中填充日期/时间

所以我有一个警报规则,当队列长度很长一段时间后,它会在普罗米修斯中触发。

通过警报管理器,我能够创建和接收电子邮件。

我现在的问题是,作为我的电子邮件正文的一部分,我想要知道警报管理器触发电子邮件或触发警报的日期和时间。

我不确定如何做到这一点。我是否可以在警报中创建一个标签并以某种方式使用当前日期/时间填充它,还是什么?有任何想法吗?

0 投票
1 回答
3437 浏览

grafana - Prometheus 直方图和包含 NaN 值的平均集

在我的应用程序中,我为每个国家/地区的 websocket ping 时间设置了直方图,每个国家/地区一个直方图。在 Grafana 中,我通过以下查询获得了我最感兴趣的几个国家/地区的平均 ping 时间图表

这工作得很好。我得到了每个国家的图表。现在我想将所有其他国家的平均值加到同一张图中。

这失败了。当我在 Prometheus 控制台的 Prometheus 查询中尝试查询时,我得到一个 NaN 值。如果我采用相同的查询并删除 avg() 函数,那么我会得到每个匹配国家/地区的列表,有些有值,有些有 NaN。许多国家的总和和计数的比率均为 0。显然,对于那些特定国家,这些除以 0 等于 NaN。

所以我的问题是,如何在传递给 avg() 之前过滤掉 NaN 值?