我们在 Win Server 机器上运行 prometheus,在单独的机器(客户端)上运行 WMI 导出器。能够读取 Prometheus 中的客户端指标。现在的要求是在 Diskspace =>90 % 的那一刻,发送电子邮件警报,以便我们可以运行作业以使用自动作业/手动作业清理空间。
你能帮忙看看如何为磁盘空间> 90配置警报吗
我们在 Win Server 机器上运行 prometheus,在单独的机器(客户端)上运行 WMI 导出器。能够读取 Prometheus 中的客户端指标。现在的要求是在 Diskspace =>90 % 的那一刻,发送电子邮件警报,以便我们可以运行作业以使用自动作业/手动作业清理空间。
你能帮忙看看如何为磁盘空间> 90配置警报吗
您可能希望根据它是否会填满而不是根据它的填充程度来发出警报:
- name: node.rules
rules:
- alert: DiskWillFillIn4Hours
expr: predict_linear(node_filesystem_free{job="node"}[1h], 4 * 3600) < 0
for: 5m
labels:
severity: page
https://www.robustperception.io/reduce-noise-from-disk-space-alerts
假设您正在使用https://github.com/martinlindhe/wmi_exporter/blob/master/docs/collector.logical_disk.md,您可以使用这些线路的东西用于> 90%的使用
- alert: DiskSpaceUsage
expr: 100.0 - 100 * (wmi_logical_disk_free_bytes / wmi_logical_disk_size_bytes) > 90
for: 10m
labels:
severity: high
annotations:
summary: "Disk Space Usage (instance {{ $labels.instance }})"
description: "Disk Space on Drive is used more than 90%\n VALUE = {{ $value }}\n LABELS: {{ $labels }}"
wmi_exporter repo 上还有其他示例,用于默认 node_exporter 指标(不确定是否适用于 windows)它应该是
- alert: DiskSpace10%Free
expr: 100 - (100 * node_filesystem_avail_bytes / node_filesystem_size_bytes) > 90
labels:
severity: moderate
annotations:
summary: "Instance {{ $labels.instance }} is low on disk space"
description: "diskspace on {{ $labels.instance }} is used over {{ $value }}% ."
´´´
要根据警报发送电子邮件通知,您需要使用 prometheus 设置警报管理器。以下是如何做到这一点的指南:https ://github.com/prometheus/alertmanager
您还可以配置警报规则。我正在使用节点导出器来获取节点指标并使用以下规则
- alert: DiskSpace10%Free
expr: node_exporter:node_filesystem_free:fs_used_percents >= 90
labels:
severity: moderate
annotations:
summary: "Instance {{ $labels.instance }} is low on disk space"
description: "{{ $labels.instance }} has only {{ $value }}% free."
您可以根据 WMI 导出器配置上述规则,一切顺利。希望这可以帮助。