在我的 Kubernetes 集群中,我有 Prometheus、Grafana 用于监控堆栈和 EFK 堆栈用于日志。
我创建了一些由来自 node-exporter 的指标触发的 Grafana 警报。
此外,我还可以在 Kibana 上看到 Kubernetes 节点 (VM) 日志。
当节点一段时间没有日志时,我想在 Grafana 上创建警报。
最好的方法是什么?
我将 ElasticSearch (ES) 作为数据源连接到 Grafana。我可以在 Grafana 图表上看到 ES 日志指标。但是,这个解决方案似乎有问题。
因为当所有旧节点都消失并创建新节点时,集群可能会被缩减 - 升级。
第一个不是什么大问题(如果警报仅在第一次满足条件时触发)
第二个可能会导致数十个警报。