问题标签 [prometheus-node-exporter]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
prometheus - 在普罗米修斯中,我添加了 ec2 实例详细信息,但它正在显示
在 Prometheus 中,我添加了 ec2 实例详细信息,但它正在显示。
google-kubernetes-engine - 如何配置prometheus kubernetes_sd_configs 指定特定主机端口?
我在 GKE 上的另一个端口(11100)上运行节点导出器,并将 prometheus.yml 配置为使用 kubernetes_sd_configs。但是,服务发现似乎正在返回带有Kubelet端口 (10250)的节点 IP <node-ip>:10250/metrics
。我似乎找不到指定使用哪个端口的方法。有任何想法吗?
此外, node-exporter 在 port 中正常运行11100
。我通过在内部节点 IP 中执行 curl 来验证它,<node-ip>:11100/metrics
它就像一个魅力
这是我的节点导出器定义
prometheus - 如果主从数据库服务器出现故障,则在 Prometheus 中触发警报
我有 2 个查询。如果它们匹配,我需要触发警报但它不起作用:
我关闭了两台服务器但没有获取数据,它说:no data
作为输出。
如果我分别运行每个查询,它就可以工作。
长话短说:
如果主数据库(DEV-DB-1-EC2)和从数据库(DEV-DB-2-EC2)都出现故障,我需要触发警报。
有人可以为此要求提供正确的语法吗?
prometheus - 减去费率和费率总和
有一个网络传输指标,例如node_network_transmit_bytes_total
,nodeexporter
我想得到一个接口的传输速率(enp3s0
在我的例子中)和所有网桥接口传输速率的总和之间的差异。
我有这样的事情:
但这没有给我任何数据点。
编辑
我已经尝试过Prometheus/PromQL 减去两个规格指标所建议的方法,但我的情况有点不同,因为在右侧我有超过 1 个系列。
所以这:
产量:
执行查询时出错:在操作右侧找到匹配组 {instance="192.168.XZ:9100", job="nodeexporter"} 的重复系列:[{ name ="node_network_transmit_bytes_total", device="br -XXXX", instance="192.168.XZ:9100", job="nodeexporter"}, { name ="node_network_transmit_bytes_total", device="br-5d6dce95c2b0", instance="192.168.XZ:9100", job="nodeexporter "}]; 不允许多对多匹配:匹配的标签在一侧必须是唯一的
我试过使用sum()
:
但这又没有结果。
编辑2
我已经设法弄清楚如何通过
但我不能使用irate
它:
执行查询时出错:1:149:解析错误:范围只允许用于向量选择器
prometheus - Prometheus (Docker):确定每个节点的可用内存(哪个指标是正确的?)
我们一直在努力为运行 Docker 组件的节点创建良好的内存监控。我们将 Prometheus 与 cadvisor 和 node_exporter 结合使用。
确定每个节点已用内存的最佳方法是什么?
方法 1:在我们的示例中给出大约 42%
方法 2 : 大约 80%
Q2:为什么会有这种差异?我能从中学到什么?
因此,我对确定的各个指标进行了更深入的研究:
空闲内存:在我们的实验中约为 5%
(node_memory_MemFree_bytes/node_memory_MemTotal_bytes)*100
缓冲内存:约 0.002%
(node_memory_Buffers_bytes/node_memory_MemTotal_bytes)*100
缓存内存:约 15%
(node_memory_Cached_bytes/node_memory_MemTotal_bytes)*100
可用内存:58%
(node_memory_MemAvailable_bytes/node_memory_MemTotal_bytes)*100
我希望 FreeMem + BufferedMem + CachedMem 会在 AvailableMem 周围。但这不是这个简单实验的结果。
Q3:为什么这不是真的?
据说Linux上的空闲内存由free mem + buffered mem + cached mem组成。当内存不足时,可以释放缓存的内存等。
prometheus - Prometheus 时间序列中的实际时间戳与 Scrape 时间戳
下面是一个示例:刮擦间隔设置为 30 秒。应用程序在一个抓取周期中生成以下时间序列:
- 名称:Counter_1,值:2,时间戳 1590285009
- 名称:Counter_1,值:4,时间戳 1590285019(第一个后 10 秒)
- 名称:Counter_1,值:0,时间戳1590285029(第二个后10秒)
在这种情况下会刮掉什么时间序列?所有三个,还是将时间戳设置为抓取时间戳的最新一个?
prometheus - 如何使用 grafana singlestat 和 prometheus 计算正常运行时间百分比
目前我正在使用以下查询计算正常运行时间百分比。
但是,如果我尝试通过重新启动服务进行测试,即如果我在 12:00 重新启动并且如果我尝试在 12:05 进行测试,它应该显示 100% 的可用性,但在我的情况下它没有显示这种方式。
请帮助正确计算正常运行时间百分比
使用的查询是
avg_over_time(up{instance="$instance", job!="jobid"}[${__range_s}s])*100
prometheus grafana 指标 promql
prometheus - Grafana“节点导出器已满”仪表板在导入后不显示任何数据
我正在尝试从这里导入 Node Exporter Full Dashboard:https ://grafana.com/grafana/dashboards/1860
但是当我导入仪表板时,它什么也没显示。
我的 Prometheus.yml 文件具有以下配置:
当我“curl http://localhost:9100/metrics ”时,我从 node_exporter 获取所有指标此外,在 Prometheus 中可以看到相同的指标。
Grafana 导入有什么问题?我究竟做错了什么?
prometheus - 使用 Prometheus 监控备份脚本
我想监视我的简单 bash 脚本以备份 cassandra,所以这是我的脚本
!/bin/bash
所以你可以在这里看到,我使用文本文件收集器,其中 node_exporter 内置,然后我想使用 alertmanager 选择它,比如 cassandra_backup_status =!0; 然后 alert_to_telegram
这种情况对吗?