我通过在每台机器上安装 Telegraf 代理来监视我们本地实验室环境中的服务器,该代理将 cpu、磁盘和内存统计信息更新到 InfluxDB。我在 kapacitor 中有引发警报的滴答脚本,但我的问题是每台服务器都有不同的指标值来监控(比如 server1 应该在 80% CPU 使用率时收到警报,server2 应该在 50% CPU 使用率时收到警报)所以这意味着我应该为每个服务器编写多个脚本因为它很难监控和维护。任何人都可以指导一下。
谢谢
我通过在每台机器上安装 Telegraf 代理来监视我们本地实验室环境中的服务器,该代理将 cpu、磁盘和内存统计信息更新到 InfluxDB。我在 kapacitor 中有引发警报的滴答脚本,但我的问题是每台服务器都有不同的指标值来监控(比如 server1 应该在 80% CPU 使用率时收到警报,server2 应该在 50% CPU 使用率时收到警报)所以这意味着我应该为每个服务器编写多个脚本因为它很难监控和维护。任何人都可以指导一下。
谢谢
您可以使用 Kapacitor 轻松创建模板任务。 https://docs.influxdata.com/kapacitor/v1.5/working/template_tasks/
但对我来说它非常受限制,所以我写了一个 jinja2 模板,它通过 yaml 配置生成任务。我只是提到它,如果你在 Kapacitor 模板中遇到一些限制。