1

好的,这是我的设置:

  • 平台:AWS
  • 监控:DataDog
  • 指标:system.disk.in_use

问:所以我正在运行 Ubuntu 18.04LTS 实例,随着时间的推移,它似乎会定期产生额外的设备:

设备:/dev/loop1、/dev/loop2 等等。

当我第一次启动这些实例时,只有 3 个 /dev/loop(1-3) 设备,但是,随着时间的推移,出现了 /dev/loop4 并且我们的驱动器空间警报向我发出了寻呼,因为这些在创建时已 100% 使用.

因此,我必须进入每个监视器(每个环境一个)并为新的 /dev/loop4 添加一个排除项,但我无法设置排除项,直到它由至少一个受监视的实例创建。

在 DataDog 中有没有一种方法可以添加一个全面排除,例如:

设备:/dev/loop*?

我一直在梳理文档并且找不到任何东西,所以我想我会在这里问。

4

2 回答 2

3

我通过将“squashfs”添加到要被数据狗代理忽略的文件系统类型列表来解决这个问题。

创建一个文件/etc/datadog-agent/conf.d/disk.d/conf.yaml

init_config:
    file_system_global_blacklist:
      - iso9660$
      - squashfs

instances:
  - use_mount: false

重新启动数据狗代理 ( systemctl restart datadog-agent)。

于 2020-10-20T01:12:43.427 回答
2

您可以使用!and *,例如:

avg:system.disk.in_use{!device:/dev/loop*} by {host,device}

资源

于 2021-10-16T02:39:26.627 回答