问题标签 [prometheus-node-exporter]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
1463 浏览

docker - 使用 SSL 通信节点导出器目标

我正在 Docker 中使用 prometheus 和 node-exporter 建立一个监控系统。我想通过 SSL 通信节点导出器目标。在端口 9100 上工作的节点导出器。所以我想在端口 9100 上使用 SSL 与所有目标通信。用图表说明:

我正在使用这个存储库:https ://github.com/stefanprodan/dockprom

你有什么建议?

0 投票
1 回答
3636 浏览

windows - 如何编写自定义节点导出器以使用 prometheus 收集机器指标?

我是 prometheus 的初学者,实际上我的 Windows 系统中有 prometheus 包。“Prometheus.exe”工作正常,我可以在浏览器中看到“localhost:9090”中的数据。

我需要抓取机器指标,例如 cpu 的总内存、可用内存、空闲内存和我的 windows 系统的缓存内存,在这里我完全卡住了,不知道这样做。

我需要编写自己的节点导出器来实现这一点吗?如果我需要编写自己的节点导出器,如何作为初学者开始?需要传递给普罗米修斯的输入格式是什么?

有人请帮助我如何使用普罗米修斯抓取我的 Windows 机器 cpu 内存详细信息,并建议您是否有任何链接来实现这一点?

0 投票
1 回答
2538 浏览

kubernetes - 什么是速率 node_context_switches_total 以及为什么 rate(node_context_switches_total[5m]) > 1000?

我已经在我的集群上设置了 prometheus,其中包含一些警报规则,如下所示:

  • alert: ContextSwitching expr: rate(node_context_switches_total[5m]) > 1000 for: 30m 标签:severity: warning

有人可以阐明这条规则的目的吗?此外,在我的情况下 rate(node_context_switches_total[5m]) 总是大于 2000。

这是我应该担心的事情吗?

0 投票
1 回答
12410 浏览

prometheus - 如何使用 prometheus 节点导出器提取正在运行的进程?

我已经在 prometheus 官方网站https://prometheus.io/download/为我的 linux 系统下载了 prometheus 节点导出器。

如果我运行节点导出器文件,它运行良好并且能够看到 9100 端口中的指标。

在 9100 指标中,我希望提取正在运行的进程(例如:我需要提取任何正在运行的应用程序,如“chrome”浏览器),但我在节点导出器目录中没有任何配置文件来过滤正在运行的进程。

他们是否有任何命令可用于过滤节点导出器中所需的运行进程,例如 ./node_exporter “filter process like 'chrome'”

我可以使用“prometheus.yml”文件“标签”来过滤我的 linux 系统中正在运行的进程吗?

请建议我,如何在节点导出器中提取运行进程和系统详细信息。

0 投票
1 回答
2240 浏览

prometheus - prometheus 样本太旧或未来太远

prometheus 和 node exporter 都使用 chrony 来同步时间。

但普罗米修斯抱怨时间不对

0 投票
3 回答
9769 浏览

kubernetes - Kubernetes 上的 prometheus 节点导出器

我已经在 kubernetes 集群(EKS)上部署了 prometheus。我能够成功地抓取prometheustraefik跟随

DaemonSet但是按照以下定义部署的节点导出器并未公开节点指标。

并在 prometheus 中关注 scrape_configs

我也尝试curl http://localhost:9100/metrics从其中一个容器中取出,但得到了curl: (7) Failed to connect to localhost port 9100: Connection refused

我在这里缺少什么配置?

在建议通过 helm 安装 Prometheus 后,我没有在测试集群上安装它,并尝试将我的原始配置与 helm 安装的 Prometheus 进行比较。

以下 pod 正在运行:

我没有在 podprometheus-prometheus-prometheus-oper-prometheus-0中找到节点导出器的任何配置/etc/prometheus/prometheus.yml

0 投票
1 回答
8459 浏览

port - 如何配置节点导出器的默认端口

我部署 Node Exporter 来监控我的系统,但是我服务器中的某些应用程序使用了端口 9100 ,并且 Node Export Services 无法启动。?如何更改 Node_Exporter 的另一个端口

感谢阅读,这是我的第一篇文章

我尝试使用 RHEL 8

`

0 投票
0 回答
312 浏览

prometheus-node-exporter - container_fs_usage_bytes 和 container_fs_writes_total 是否相关指标?

我有在 k8s 中运行的 Prometheus,对于 container_fs_usage_bytes 和 container_fs_writes_total 我有相同的导出器,我希望这些值应该相关,所以当我看到磁盘消耗时,我也应该看到磁盘写入。但目前它们显示出不同的价值。

container_fs_usage_bytes 和 container_fs_writes_total 必须相关吗?

0 投票
1 回答
804 浏览

ipv6 - Prometheus IPv6 因“连接:无效参数”而失败

我目前正在尝试设置必须使用 IPv6 的内部 Prometheus 监控系统。我的静态配置不起作用:

这失败并出现错误

获取http://[fe80::3086:7bff:fed8:f402]:9100/metrics : 拨号 tcp [fe80::3086:7bff:fed8:f402]:9100: connect: 无效参数


我尝试使用 CURL 来查看是否可以连接到运行 node-exporter 的远程服务器。

这没有用:curl -g -6 'http://[fe80::3086:7bff:fed8:f402]:9100/metrics'

但这确实有效:curl -g -6 'http://[fe80::3086:7bff:fed8:f402%ens17]:9100/metrics'

这表明我实际上能够连接到服务器,但必须将连接 IPv6 网络顶部的网络接口添加到 URL 中。老实说,我不知道为什么。

但是现在,同样的 URL 对 prometheus 不起作用,仍然有一个错误:

0 投票
1 回答
137 浏览

kubernetes - 如果节点没有日志,则发出警报

在我的 Kubernetes 集群中,我有 Prometheus、Grafana 用于监控堆栈和 EFK 堆栈用于日志。

我创建了一些由来自 node-exporter 的指标触发的 Grafana 警报。

此外,我还可以在 Kibana 上看到 Kubernetes 节点 (VM) 日志。

当节点一段时间没有日志时,我想在 Grafana 上创建警报。

最好的方法是什么?

我将 ElasticSearch (ES) 作为数据源连接到 Grafana。我可以在 Grafana 图表上看到 ES 日志指标。但是,这个解决方案似乎有问题。

因为当所有旧节点都消失并创建新节点时,集群可能会被缩减 - 升级。

第一个不是什么大问题(如果警报仅在第一次满足条件时触发)

第二个可能会导致数十个警报。