问题标签 [prometheus-node-exporter]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
462 浏览

prometheus - Prometheus 节点导出器不会提供磁盘卷信息

Prometheus 节点导出器展示

对于其他磁盘(目录),除了

像设备

挂载到目录

有没有一样的?

0 投票
1 回答
502 浏览

prometheus - 如何标记警报以了解 Prometheus 中的目标对象?

我在 Prometheus 上实习,遇到了一个简单的问题:我的老板想根据员工使用的服务来提醒他们。因此,例如招聘人员只需要来自某些服务的“向下”警报,来自其他一些服务的销售人员等。

(例如,如果服务 1 崩溃,则需要通知招聘人员和销售团队,而不是供应商,因为他们不需要该服务。)

因此,我需要能够将目标 MULTIPLE 值赋予单个标签,从我一直阅读的内容来看,这是不可能的。(类似于:服务:“招聘人员”,“销售”)

我怎样才能做到这一点?能够根据谁使用它给目标一个标签多个值?

预先感谢您的回答,

达米安

0 投票
1 回答
196 浏览

docker-compose - 来自不同挂载点的相同值

请帮帮我!我有虚拟机。服务器 Ubuntu 18.04 并在 docker 下安装 node-exporter prometheus。在服务器上,我有几个磁盘。但在指标中,我看到来自不同磁盘的相同值。请帮忙,怎么了?谢谢! df信息

指标信息

码头工人撰写文件

0 投票
1 回答
239 浏览

prometheus - 需要在 Java 应用程序的 Grafana 中显示指标也用于 Spark 配置批处理应用程序

我有一个用例,我需要将我的 java 应用程序的矩阵显示到 Grafana 中,但我的是批处理应用程序而不是时间序列,我将数据存储在关系数据库中。我怎么可能喜欢将数据推送到像 Prometheus 这样的时间序列,或者是否有任何可用于 Grafana 的插件我们可以直接使用?

而且我还想监控我的 spark 工作和相关的东西,比如驱动器、JVM 等的内存。

关于如何开始的任何帮助或线索?

0 投票
1 回答
3310 浏览

azure - 普罗米修斯。CPU 处理时间总计为 %%

我们开始使用PrometheusGrafana作为监控 Service Fabric 集群的主要工具。对于 Prometheus,我们使用wmi_exporter,并带有预定义的参数:CPU、系统、进程、服务、内存等。我们的主要目标是开始在 Azure Service Fabric 中的每个实例的节点组上监控我们的产品服务。

例如,我们使用这个 PQuery 来计算总 CPU 使用率(以 % 为单位):

100 - (avg by (hostname) (irate(wmi_cpu_time_total{scaleset="name",mode="idle" }[5m])) * 100)和指标 +- 看起来很现实。

直到我们开始编写服务查询。

对于服务,sum by (process,hostname)(irate(wmi_process_cpu_time_total{scaleset="name", process=~"processes"}[5m])) * 100和指标有时似乎不现实,尤其是在将其与总 CPU 时间百分比进行比较后很明显。我发现了一篇关于乘以 100 以获得 CPU 时间百分比的文章,但在这种情况下,我得到的指标大约为 170% 或更多。也许我需要将它划分为 CPU 内核的数量?

关于查询,我使用sum过程,因为我在userprivileged两种模式下为一个进程获得了两个不同的指标。

谁能帮我正确计算 CPU 处理时间总指标并将它们转换为 perc。?

谢谢你,我会很感激任何帮助!

0 投票
0 回答
337 浏览

kubernetes - 如何使用入口控制器访问自定义 URL 上的 Kube 状态指标服务指标

我有一个中央集群,在上面配置了我的 promethus 和 grafana Dashboard。这个想法是使用这个中央集群并从不同的集群中导出指标并在中央集群上查看它。每个应用程序都有自己的 grafana 仪表板。所以我的想法是在我的 kubernetes 集群上安装 kube-state-metrics 和 node_exporter 并使用入口控制器导出指标。

如果我一次使用一个出口商,我就能做到。但我的想法是同时使用这两个出口商。问题是 Kube 状态指标服务公开了 /metrics URI 上的所有指标,而 node_exporter 也公开了 /metrics URI 上的所有指标。

现在是我可以自定义 kube-state-metrics 端点以在我的入口控制器中使用它的一种方式。

例如

0 投票
1 回答
3603 浏览

networking - 使用 Prometheus 和 Grafana 的网络传输速度(以 MB/s 为单位)

我正在尝试使用以下 Prometheus 查询在 Grafana 中创建一个图表以显示机器的网络传输速度(以 MB/s 或类似单位)

但是,这给了我一个非常平坦的图表,并且该值似乎也处于错误的数量级。

在此处输入图像描述

Prometheus 正在抓取默认节点导出器以获取包括node_network_receive_bytes_total和在内的指标node_network_transmit_bytes_total

在此处输入图像描述

iftop显示下载传输速度约为 10+ Mbps,远高于 Grafana 图中计算的 1 KBps。

在 Prometheus/Grafana 中计算网络传输带宽的正确查询应该是什么?

编辑:节点导出器在 Docker 容器内运行。

0 投票
1 回答
445 浏览

prometheus - 记录最近 24 小时的 cpu 使用数据并在 Prometheus 监控中运行查询

我正在使用 Prometheus 监控来监控几个节点(虚拟机)。我正在尝试编写警报规则,即如果过去 24 小时内所有 cpu 核心使用率的平均值小于阈值,则触发相同的警报。. (基本上,如果虚拟机在过去 24 小时内一直处于空闲状态,则发出警报)。

为此,我想创建一个记录规则来记录过去 24 小时的数据,然后我想创建一个警报来分析过去 24 小时的数据并在查询为真时发出警报)。

应该是什么规则 yaml 文件。

0 投票
1 回答
1065 浏览

docker - prometheus 无法访问节点导出器

我正在学习 prometheus 和 node_exporter 并尝试通过 docker 在本地设置它们。我从这个https://hub.docker.com/r/prom/node-exporter和这个https://hub.docker.com/r/prom/prometheus下载了 docker 镜像,然后使用命令运行它们:

在运行 prometheus 之前,我添加了 yml 文件:

但似乎prometheus无法到达node_export。我看到来自 node_export 的指标 -> 在此处输入图像描述

我看到了普罗米修斯的指标-> 在此处输入图像描述

但我无法从 prometheus 网络浏览器获取 node_export 指标:

在此处输入图像描述

顺便prometheus读取yml文件: 在此处输入图像描述

我做错了什么?

UDP:很好,似乎 localhost:9100 无法访问 在此处输入图像描述

0 投票
0 回答
249 浏览

graphite - 无法将指标发送到石墨导出器

我正在尝试使用 nc 命令将自定义指标发送到石墨导出器,但未成功。以下是步骤:

我不确定将指标推送到石墨出口商我做错了什么,非常感谢任何帮助。