问题标签 [prometheus-node-exporter]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
prometheus - 节点导出器显示错误的空闲 CPU 时间
我已经使用 prometheus、AWS EC2 自动发现和节点导出器建立了一个监控系统。使用以下公式获取 CPU 利用率:
100 - (avg by (instance) (irate(node_cpu_seconds_total{instance="instancexyz" ,mode="idle"}[5m])) * 100)
但是,在一个特定的 ASG 中,我得到的 CPU 百分比是较大的负值。我打开了 instance:9100/metrics 链接,发现空闲值是大指数值。这是我得到的一个值:
node_cpu_seconds_total{cpu="0",mode="idle"} 4.25766215e+06
除少数实例外,这些指标在我的所有实例上都运行良好。知道发生了什么吗?
c# - 我们可以从 pushgateway directlt 获取指标吗?
我已将自定义指标推送到 pushgateway 中,prometheus每 15 秒抓取一次。在此之前我需要获取指标。pushgateway 和 prometheus 都托管在我的公司服务器中,因此无法更改抓取间隔。有没有办法直接从 pushgateway 获取指标?
prometheus - blackbox exporter ssh 连接测试问题
伙计们:
我正在使用 blackbox exporter 来测试许多远程服务器的 ssh 端口 22,模块是 ssh_banner。问题是它总是为每个 ssh 测试打印一个远程服务器的日志。:
有谁知道如何在不更改 sshd 日志级别或任何 sshd 配置的情况下解决此问题。
谢谢
prometheus - Prometheus 和 Node Exporter 架构
我已经阅读了 3 天,甚至配置了一组容器来测试它们,但我有疑问。
我了解 Prometheus + Node exporter 的架构基于:
- 节点导出器知道如何提取指标。这些在 HTTP 中公开,例如。:9201/公制
- Prometheus 每 X 秒查询一次这些 HTTP 端点(节点导出器 HTTTP)并存储指标。它还为图形/控制台可视化/查询提供了另一种 HTTP。
问题一:
假设您需要每 15 秒的 CPU 指标、每 5m 的 HDD 指标、每 1m 的网络、每 30 秒的进程。
既然是普罗米修斯决定了抓取间隔,那么如何配置为只抓取这些值呢?
问题2:
假设您需要 1 个 prometheus 实例和 3 个节点导出器,不同的公共服务器。我没有看到有关节点导出器及其安全性的任何信息。HTTP 端点是公共的。
如何安全地从我的 3 台服务器查询指标?
问题 3:
我不知道我是否遗漏了什么。但是,例如,将其与 Telegraf 进行比较,后者将指标发送到数据库。因此,Telegraf 充当“节点出口商”。我只需要保护数据库连接(仅暴露端口)。
可以将 node-exporter 配置为每 X 次向 prometheus 服务器发送一组指标吗?(所以我不必在每个公共服务器中公开一个公共端口,只需在普罗米修斯服务器上)我明白“pushgateway”是为了那个吗?如何更改节点导出器的行为?
您是否向我推荐任何其他可以满足我需求的架构?(1个master,多个slave查询metrics)
prometheus - 如何使用 Prometheus 显示集群的汇总 CPU、RAM、磁盘 I/O 使用情况?
我有 3 台服务器。我将 Prometheus 与 Node 导出器一起使用,并且为了可视化 Prometheus 数据,我正在使用 Grafana。Node Exporter Full (1860) 仪表板只能单独显示每个服务器的 CPU、RAM、磁盘 I/O 使用情况。我想获取总体使用情况,例如,我想获取整个集群 (sarver1 + sarver2 + sarver3) 的汇总 CPU、RAM 和磁盘 I/O 使用情况。我应该使用哪些查询来获取集群资源的总利用率?
prometheus - Prometheus 查询计算 avg_over_time up-time,但想忽略 down-time 小于 1 分钟
我是 Prometheus 的新手,并在下面进行了查询,试图以百分比显示某个网站的平均正常运行时间以进行 SLA 监控(例如 Google)。
但是,是否可以让计算忽略少于 1 分钟的任何停机时间?
prometheus - 按特定时间段删除时间序列指标 Prometheus
我在https://www.shellhacks.com/prometheus-delete-time-series-metrics/上读到,可以删除我们在 Prometheus 上不需要的时间序列指标。
但是无论如何要在特定时间段内删除它们;说在周一至周五下午 5 点到早上 6 点等期间删除指标?
go - How to get Prometheus Node Exporter metrics with JSON format
I deployed Prometheus Node Exporter pod on k8s. It worked fine.
But when I try to get system metrics by calling Node Exporter metric API in my custom Go application
The result format was like this
Those long texts are hard to parse and I want to get the results in JSON format to parse them easily.
https://github.com/prometheus/node_exporter/issues/1062
I checked Prometheus Node Exporter GitHub Issues and someone recommended prom2json. But this is not I'm looking for. Because I have to run extra process to execute prom2json to get results. I want to get Node Exporter's system metric by simply calling HTTP request or some kind of Go native packages in my code.
How can I get those Node Exporter metrics in JSON format?
prometheus - Prometheus 中合成序列的条件规则
我想从节点导出器获取时间序列向量node_memory_MemAvailable_bytes 。它在 RHEL7 上运行良好,但在 RHEL6 上不存在此数据,因为旧内核上的 /proc/meminfo 中不存在此数据。
所以没问题,Prometheus 让我可以通过它的规则来计算这个时间序列向量。
我想总结node_memory_MemFree_bytes + node_memory_Buffers_bytes + node_memory_Cached_bytes。(这可能不准确,但在大多数情况下似乎很好)。
我在 Prometheus 主配置文件中创建了这样的字符串
和这样的文件prometheus.rules.yml:
并且出现了新的时间序列node_memory_MemAvailableRH6_bytes。
但是......它也出现在 RHEL7 主机上!
我找不到如何处理它。
是否可以仅在不存在node_memory_MemAvailable_bytes的情况下应用我的规则?
或者
仅当node_memory_MemAvailable_bytes不存在时,是否可以要求 Grafana 绘制node_memory_MemAvailableRH6_bytes图形?
PS/我不想在 Prometheus 规则中用 node_memory_MemAvailableRH6_bytes 重写 node_memory_MemAvailable_bytes,因为我的总和不准确。