我正在尝试使用 grafana 和 prometheus 实现警报。
由于 Grafana 不允许在警报中使用指标中的模板变量,因此如果我想收集内存指标,我目前被迫对 IP 进行硬编码。
但这不是一个持久的解决方案,因为我的设置中的节点可以终止并在启用自动缩放时重新创建。
有没有比在指标中硬编码每个实例 IP 并仍然启用每个节点的内存使用警报更好的选择?
任何帮助将不胜感激。
我正在尝试使用 grafana 和 prometheus 实现警报。
由于 Grafana 不允许在警报中使用指标中的模板变量,因此如果我想收集内存指标,我目前被迫对 IP 进行硬编码。
但这不是一个持久的解决方案,因为我的设置中的节点可以终止并在启用自动缩放时重新创建。
有没有比在指标中硬编码每个实例 IP 并仍然启用每个节点的内存使用警报更好的选择?
任何帮助将不胜感激。
是的,这就是我们放弃在 Grafana 中使用警报并决定使用Alertmanager的原因。为此,您需要创建警报规则并将它们添加到集群上的 PrometheusRule 资源并配置警报管理器本身。