我有一个有两个节点的 Swarm,我正在将 cadvisor 作为一项全球服务运行。我得到了指标,grafana/Promethues 可以抓取它们。但是我的数字是错误的。当我使用 docker 命令行工具检查容器数量时,我看到第一个节点上运行了 17 个容器,第二个节点上运行了 14 个容器。然而,Prometheus/grafana 会告诉我我有 34 个容器,两个节点上的容器数量都是 17。
我认为我的问题来自将 cadvisor 定义在与 prometheus 和 grafana 容器不同的堆栈中,并尝试通过服务 API 访问 cadvisor。
在堆栈中 AI 有
version: '3.6'
services:
cadvisor:
image: google/cadvisor
deploy:
mode: global
ports:
- "8888:8080"
#privileged: true
#command:
volumes:
- /:/rootfs:ro
- /var/run:/var/run:rw
- /sys:/sys:ro
- /var/lib/docker/:/var/lib/docker:ro
然后在 prometheus.yml 配置中,我有以下抓取定义,其中 host1 和 host2 是节点的主机名。
- job_name: 'cadvisor'
scrape_interval: 20s
static_configs:
- targets: ['host1:8888','host2:8888']
是否有人在具有多个节点的集群中使用 cadvisor 的工作示例,或者可以指出如何在 proemtheus 配置中为 cadvisor 定义目标?