问题标签 [prometheus-node-exporter]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
4248 浏览

docker-compose - 如何设置 Prometheus 的 node-exporter

如何设置 Prometheus 的节点导出器以在 docker-swarm 中收集主机指标

我收到此错误:- node_exporter: error: unknown long flag '--collector.enabled',请尝试 --help 关于此 docker-compose 文件中命令部分下的最后一行的问题,如果设置/传递错误,如何传递它正确。

0 投票
1 回答
222 浏览

docker - 普罗米修斯从另一台机器上抓取

我在 Amazon ecs 的 docker 容器上运行节点导出器,并且我希望能够从运行 Prometheus 的同一网络中的另一台机器(也不是本地)中抓取指标。如何在 docker 和 ecs 上公开端口才能这样做?还是有更好的方法来做到这一点?

编辑:ecs访问需要身份验证,所以只是将ip添加到yml文件中是行不通的

0 投票
0 回答
1327 浏览

docker - 使用 docker compose 在多个节点上使用 Prometheus + Grafana

我正在使用 cadvisor 和 node_exporter 设置 prometheus + grafana。我需要收集 2 台以上服务器的指标。但是可以说我不会为 2 做这件事。我正在使用 docker compose。

在主服务器上,我有以下配置:

这是我的 docker-compose.yml;在工作服务器上

当我只设置 master 时,grafana 中的一切看起来都不错。但是当我在工作节点上启动容器时,grafana 中的一切都出错了。我只看到容器的数量。其他一切都是 N/A。

请您告知我的配置中的问题在哪里?我想在 grafana 中有很好的视图,我可以在其中选择 node1 或 node2 并查看所有指标。

谢谢

0 投票
0 回答
532 浏览

kubernetes - 如何配置 kubernetes_sd_configs 以发现不同集群中的服务

我在 Prometheus 中创建了一个作业,kubernetes_sd_configs可以自动发现服务而无需手动声明它们(Cadvisor、nodeexporter、KubeStateMetrics)。我正在为 Prometheus 使用舵图。我尝试了这项工作,它只能发现集群本身(安装了 Prometheus 服务器的同一集群)中的服务,但不能发现其他集群。

这是我创建的工作:

  • 作业名称:'kubernetes-nodes-cadvisor-aks-NEWUATBACK'

    /li>

有人对此有任何想法吗?

0 投票
0 回答
685 浏览

prometheus - 如何将多个作业添加到 Prometheus 控制台?

我有一个在 AWS 上运行的测试实例来体验 Prometheus 监控。我对 Prometheus 的安装并在 Prometheus 服务器的控制台上运行一些简单的查询没有任何问题。

我刚刚添加了两个实例来设置 Prometheus 的 node_exporter 模块来检查 CPU 利用率。我还将这两个节点添加到 Prometheus 配置文件中。当我使用“node_memory_MemAvailable_bytes”命令检查时,我可以看到所有节点。但我想检查同一图中所有节点的 CPU 利用率。通过输入作业名称,我只能使用以下命令看到一个节点。我的问题是如何将多个作业添加到以下命令?还是有另一种方法可以检查同一图中的所有节点 CPU 利用率?

0 投票
0 回答
590 浏览

grafana - 基于模板变量创建单态面板的动态仪表板

我想为我的集群节点创建一个动态仪表板。该仪表板将由多个单一状态面板组成。每个显示一个节点的状态和名称

所以这就是我所做的:

  • 通过检查多值组合创建模板变量 list_of_vm = label_values(up{job="node_exporter"},instance) 其结果类似于 ip1:port, ip2:port, ... , ip7:port
  • 创建一个单状态面板,重复面板设置为 list_of_vm。在我设置的指标中{instance="$list_of_vm",job="node_exporter"}

检查模板变量中的所有实例后,面板被正确复制,但它们的值是错误的,因为在度量中,查询被评估为:up{instance="$list_of_vm",job="node_exporter"} 当 list_of_vm = "ip1:端口+ip2:端口+..+ip7:端口”

我希望第一个面板有 ip1:port,第二个面板有 ip2:port ......

你有什么想法来解决这个问题

0 投票
2 回答
6950 浏览

grafana - Prometheus:帮助编辑/配置 Cisco MIB 的 snmp_exporter 的 generator.yml 文件

我一直在尝试将 Prometheus 配置为从 Cisco 设备收集 SNMP 信息,然后将该数据发送到 Grafana。我遇到的问题或问题是配置生成 snmp.yml 的 generator.yml 文件。

我按照此处列出的说明进行操作: https ://github.com/prometheus/snmp_exporter/tree/master/generator

我能够毫无问题地按照这些步骤进行操作。完成这些步骤时,您会下载 Cisco MIB。我把它们放在一个目录中。我相信我的主要问题是我不知道如何在 generator.yml 文件中引用 Cisco MIB。

我尝试按照此处列出的示例进行操作:http: //devopstarter.info/snmp-exporter-generator-tutorial/

作者给出了一个简短的例子来说明如何编辑华为的 generator.yml 文件。

默认的 generator.yml 将创建一个 snmp.yml 文件,其中包含预先配置的所有模块。所以,我快到了。我只需要一点帮助来添加我想要的 Cisco 模块。

有没有人偶然知道我会怎么做?或者有使用生成器文件和他们添加的模块/mib 的经验?

这是默认的 generator.yml:

0 投票
1 回答
1990 浏览

nginx - nginx-prometheus-exporter 部署失败

我正在尝试Nginx使用nginx-prometheus-exporter. 以下是我的部署

nginx-prometheus-exporter单容器 pod 可以工作,但是当我添加边车容器时失败。

也能够curl http://nginx.local.svc.cluster.local从另一个容器中运行在不同的命名空间中。

任何人都知道指定的正确方法是 -nginx.scrape-uri什么?

来自 Nginx 容器

0 投票
0 回答
616 浏览

kubernetes - Prometheus:将矩阵推送到 PushGateway 的代理组件

在此处输入图像描述

在我们正在构建的系统中,我们需要使用 Prometheus 监控在 k8s 集群中运行的组件(Kafka Connect、Spark..等)。由于 k8s 集群运行在不同的网络中,Prometheus 服务器无法直接抓取这些组件。为此,我们将在我们的 k8s 集群中运行 PushGateWay。

我想出了以下设计:

  1. 自定义构建的“推送代理”组件读取“kube-api-service”以获取我们要监视的每个组件的 pod 列表。(还定期检查 pod 健康/检查新 pod ..等)
  2. “推送代理”会定期在每个 pod 中报废出口商。(调用每个 pod 的 /metrics 端点)。将这些刮取的矩阵存储在缓冲区中。
  3. “推送代理”定期将缓冲的矩阵推送到 PushGateWay。
  4. 这个 PushGateWay 可以从 Prometheus 访问。Prometheus 定期从 PushGW 刮取矩阵。

问题是:

  1. 有没有像我们计划构建的“推送代理”这样的组件?
  2. 这是处理此问题的有效设计吗?
0 投票
1 回答
5379 浏览

linux - Node Exporter 绑定地址已经在运行

节点导出器始终在我的本地计算机上运行 localhost:9100 即使我没有在以下错误消息之后使用终端执行它:

通过它我可以理解这个端口号已经被另一个应用程序使用,但问题是我没有在那里托管任何东西。这就是 netstat | grep 9100 给出: