问题标签 [prometheus-node-exporter]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
docker - 使用 SSL 通信节点导出器目标
我正在 Docker 中使用 prometheus 和 node-exporter 建立一个监控系统。我想通过 SSL 通信节点导出器目标。在端口 9100 上工作的节点导出器。所以我想在端口 9100 上使用 SSL 与所有目标通信。用图表说明:
我正在使用这个存储库:https ://github.com/stefanprodan/dockprom
你有什么建议?
windows - 如何编写自定义节点导出器以使用 prometheus 收集机器指标?
我是 prometheus 的初学者,实际上我的 Windows 系统中有 prometheus 包。“Prometheus.exe”工作正常,我可以在浏览器中看到“localhost:9090”中的数据。
我需要抓取机器指标,例如 cpu 的总内存、可用内存、空闲内存和我的 windows 系统的缓存内存,在这里我完全卡住了,不知道这样做。
我需要编写自己的节点导出器来实现这一点吗?如果我需要编写自己的节点导出器,如何作为初学者开始?需要传递给普罗米修斯的输入格式是什么?
有人请帮助我如何使用普罗米修斯抓取我的 Windows 机器 cpu 内存详细信息,并建议您是否有任何链接来实现这一点?
kubernetes - 什么是速率 node_context_switches_total 以及为什么 rate(node_context_switches_total[5m]) > 1000?
我已经在我的集群上设置了 prometheus,其中包含一些警报规则,如下所示:
- alert: ContextSwitching expr: rate(node_context_switches_total[5m]) > 1000 for: 30m 标签:severity: warning
有人可以阐明这条规则的目的吗?此外,在我的情况下 rate(node_context_switches_total[5m]) 总是大于 2000。
这是我应该担心的事情吗?
prometheus - 如何使用 prometheus 节点导出器提取正在运行的进程?
我已经在 prometheus 官方网站https://prometheus.io/download/为我的 linux 系统下载了 prometheus 节点导出器。
如果我运行节点导出器文件,它运行良好并且能够看到 9100 端口中的指标。
在 9100 指标中,我希望提取正在运行的进程(例如:我需要提取任何正在运行的应用程序,如“chrome”浏览器),但我在节点导出器目录中没有任何配置文件来过滤正在运行的进程。
他们是否有任何命令可用于过滤节点导出器中所需的运行进程,例如 ./node_exporter “filter process like 'chrome'”
我可以使用“prometheus.yml”文件“标签”来过滤我的 linux 系统中正在运行的进程吗?
请建议我,如何在节点导出器中提取运行进程和系统详细信息。
prometheus - prometheus 样本太旧或未来太远
prometheus 和 node exporter 都使用 chrony 来同步时间。
但普罗米修斯抱怨时间不对
kubernetes - Kubernetes 上的 prometheus 节点导出器
我已经在 kubernetes 集群(EKS)上部署了 prometheus。我能够成功地抓取prometheus
并traefik
跟随
DaemonSet
但是按照以下定义部署的节点导出器并未公开节点指标。
并在 prometheus 中关注 scrape_configs
我也尝试curl http://localhost:9100/metrics
从其中一个容器中取出,但得到了curl: (7) Failed to connect to localhost port 9100: Connection refused
我在这里缺少什么配置?
在建议通过 helm 安装 Prometheus 后,我没有在测试集群上安装它,并尝试将我的原始配置与 helm 安装的 Prometheus 进行比较。
以下 pod 正在运行:
我没有在 podprometheus-prometheus-prometheus-oper-prometheus-0
中找到节点导出器的任何配置/etc/prometheus/prometheus.yml
port - 如何配置节点导出器的默认端口
我部署 Node Exporter 来监控我的系统,但是我服务器中的某些应用程序使用了端口 9100 ,并且 Node Export Services 无法启动。?如何更改 Node_Exporter 的另一个端口
感谢阅读,这是我的第一篇文章
我尝试使用 RHEL 8
`
prometheus-node-exporter - container_fs_usage_bytes 和 container_fs_writes_total 是否相关指标?
我有在 k8s 中运行的 Prometheus,对于 container_fs_usage_bytes 和 container_fs_writes_total 我有相同的导出器,我希望这些值应该相关,所以当我看到磁盘消耗时,我也应该看到磁盘写入。但目前它们显示出不同的价值。
container_fs_usage_bytes 和 container_fs_writes_total 必须相关吗?
ipv6 - Prometheus IPv6 因“连接:无效参数”而失败
我目前正在尝试设置必须使用 IPv6 的内部 Prometheus 监控系统。我的静态配置不起作用:
这失败并出现错误
获取http://[fe80::3086:7bff:fed8:f402]:9100/metrics : 拨号 tcp [fe80::3086:7bff:fed8:f402]:9100: connect: 无效参数
我尝试使用 CURL 来查看是否可以连接到运行 node-exporter 的远程服务器。
这没有用:curl -g -6 'http://[fe80::3086:7bff:fed8:f402]:9100/metrics'
但这确实有效:curl -g -6 'http://[fe80::3086:7bff:fed8:f402%ens17]:9100/metrics'
这表明我实际上能够连接到服务器,但必须将连接 IPv6 网络顶部的网络接口添加到 URL 中。老实说,我不知道为什么。
但是现在,同样的 URL 对 prometheus 不起作用,仍然有一个错误:
kubernetes - 如果节点没有日志,则发出警报
在我的 Kubernetes 集群中,我有 Prometheus、Grafana 用于监控堆栈和 EFK 堆栈用于日志。
我创建了一些由来自 node-exporter 的指标触发的 Grafana 警报。
此外,我还可以在 Kibana 上看到 Kubernetes 节点 (VM) 日志。
当节点一段时间没有日志时,我想在 Grafana 上创建警报。
最好的方法是什么?
我将 ElasticSearch (ES) 作为数据源连接到 Grafana。我可以在 Grafana 图表上看到 ES 日志指标。但是,这个解决方案似乎有问题。
因为当所有旧节点都消失并创建新节点时,集群可能会被缩减 - 升级。
第一个不是什么大问题(如果警报仅在第一次满足条件时触发)
第二个可能会导致数十个警报。