问题标签 [prometheus-node-exporter]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
56 浏览

prometheus - 在普罗米修斯中,我添加了 ec2 实例详细信息,但它正在显示

在 Prometheus 中,我添加了 ec2 实例详细信息,但它正在显示。

在此处输入图像描述

0 投票
1 回答
1288 浏览

google-kubernetes-engine - 如何配置prometheus kubernetes_sd_configs 指定特定主机端口?

我在 GKE 上的另一个端口(11100)上运行节点导出器,并将 prometheus.yml 配置为使用 kubernetes_sd_configs。但是,服务发现似乎正在返回带有Kubelet端口 (10250)的节点 IP <node-ip>:10250/metrics。我似乎找不到指定使用哪个端口的方法。有任何想法吗?

此外, node-exporter 在 port 中正常运行11100。我通过在内部节点 IP 中执行 curl 来验证它,<node-ip>:11100/metrics它就像一个魅力


这是我的节点导出器定义

0 投票
1 回答
195 浏览

prometheus - 如果主从数据库服务器出现故障,则在 Prometheus 中触发警报

我有 2 个查询。如果它们匹配,我需要触发警报但它不起作用:

我关闭了两台服务器但没有获取数据,它说:no data作为输出。

如果我分别运行每个查询,它就可以工作。

长话短说:

如果主数据库(DEV-DB-1-EC2)从数据库(DEV-DB-2-EC2)都出现故障,我需要触发警报。

有人可以为此要求提供正确的语法吗?

0 投票
1 回答
1498 浏览

prometheus - 减去费率和费率总和

有一个网络传输指标,例如node_network_transmit_bytes_totalnodeexporter我想得到一个接口的传输速率(enp3s0在我的例子中)和所有网桥接口传输速率的总和之间的差异。

我有这样的事情:

但这没有给我任何数据点。

编辑

我已经尝试过Prometheus/PromQL 减去两个规格指标所建议的方法,但我的情况有点不同,因为在右侧我有超过 1 个系列。

所以这:

产量:

执行查询时出错:在操作右侧找到匹配组 {instance="192.168.XZ:9100", job="nodeexporter"} 的重复系列:[{ name ="node_network_transmit_bytes_total", device="br -XXXX", instance="192.168.XZ:9100", job="nodeexporter"}, { name ="node_network_transmit_bytes_total", device="br-5d6dce95c2b0", instance="192.168.XZ:9100", job="nodeexporter "}]; 不允许多对多匹配:匹配的标签在一侧必须是唯一的

我试过使用sum()

但这又没有结果。

编辑2

我已经设法弄清楚如何通过

但我不能使用irate它:

执行查询时出错:1:149:解析错误:范围只允许用于向量选择器

0 投票
1 回答
2423 浏览

prometheus - Prometheus (Docker):确定每个节点的可用内存(哪个指标是正确的?)

我们一直在努力为运行 Docker 组件的节点创建良好的内存监控。我们将 Prometheus 与 cadvisor 和 node_exporter 结合使用。

确定每个节点已用内存的最佳方法是什么?

方法 1:在我们的示例中给出大约 42%

方法 2 : 大约 80%

Q2:为什么会有这种差异?我能从中学到什么?

因此,我对确定的各个指标进行了更深入的研究:

  1. 空闲内存:在我们的实验中约为 5%

    (node_memory_MemFree_bytes/node_memory_MemTotal_bytes)*100

  2. 缓冲内存:约 0.002%

    (node_memory_Buffers_bytes/node_memory_MemTotal_bytes)*100

  3. 缓存内存:约 15%

    (node_memory_Cached_bytes/node_memory_MemTotal_bytes)*100

  4. 可用内存:58%

    (node_memory_MemAvailable_bytes/node_memory_MemTotal_bytes)*100

我希望 FreeMem + BufferedMem + CachedMem 会在 AvailableMem 周围。但这不是这个简单实验的结果。

Q3:为什么这不是真的?

据说Linux上的空闲内存由free mem + buffered mem + cached mem组成。当内存不足时,可以释放缓存的内存等。

0 投票
2 回答
1503 浏览

prometheus - Prometheus 时间序列中的实际时间戳与 Scrape 时间戳

下面是一个示例:刮擦间隔设置为 30 秒。应用程序在一个抓取周期中生成以下时间序列:

  1. 名称:Counter_1,值:2,时间戳 1590285009
  2. 名称:Counter_1,值:4,时间戳 1590285019(第一个后 10 秒)
  3. 名称:Counter_1,值:0,时间戳1590285029(第二个后10秒)

在这种情况下会刮掉什么时间序列?所有三个,还是将时间戳设置为抓取时间戳的最新一个?

0 投票
1 回答
2980 浏览

prometheus - 如何使用 grafana singlestat 和 prometheus 计算正常运行时间百分比

目前我正在使用以下查询计算正常运行时间百分比。

但是,如果我尝试通过重新启动服务进行测试,即如果我在 12:00 重新启动并且如果我尝试在 12:05 进行测试,它应该显示 100% 的可用性,但在我的情况下它没有显示这种方式。

请帮助正确计算正常运行时间百分比

使用的查询是

avg_over_time(up{instance="$instance", job!="jobid"}[${__range_s}s])*100

prometheus grafana 指标 promql

0 投票
0 回答
239 浏览

prometheus - 无法在 Grafana 中获取 Prometheus SD 目标

我已经配置了 Prometheus 服务发现:

普罗米修斯.yml:

并自动发现两个实例:

在此处输入图像描述

两个实例也返回指标:

然后我添加了 Prometheus 作为数据源并导入了 1860 仪表板,但是当 GP 被列为作业时没有显示任何数据:

在此处输入图像描述

为了测试目的,我还硬编码了 Prometheus Job:

有了这个,它可以工作:

在此处输入图像描述

我究竟做错了什么?

此外,主机值对于两者GP和始终相同nodeexporter。另外,Prometheus 的其他三个工作(cadvisor、prometheus、pushgateway)都没有暴露在下拉列表中,这也令人困惑

0 投票
1 回答
1677 浏览

prometheus - Grafana“节点导出器已满”仪表板在导入后不显示任何数据

我正在尝试从这里导入 Node Exporter Full Dashboard:https ://grafana.com/grafana/dashboards/1860

但是当我导入仪表板时,它什么也没显示。

导入后的 Grafana 仪表板

我的 Prometheus.yml 文件具有以下配置:

prometheus.yml 配置文件

数据源经过测试并且工作正常: 普罗米修斯数据源

当我“curl http://localhost:9100/metrics ”时,我从 node_exporter 获取所有指标此外,在 Prometheus 中可以看到相同的指标。

Grafana 导入有什么问题?我究竟做错了什么?

0 投票
1 回答
836 浏览

prometheus - 使用 Prometheus 监控备份脚本

我想监视我的简单 bash 脚本以备份 cassandra,所以这是我的脚本

!/bin/bash

所以你可以在这里看到,我使用文本文件收集器,其中 node_exporter 内置,然后我想使用 alertmanager 选择它,比如 cassandra_backup_status =!0; 然后 alert_to_telegram

这种情况对吗?