我有以下设置:
K8 Ingress --> K8 Service --> K8 Pods x n
(GCP LB for SSL) (NodePort) (containing the application)
我可以设置一个堆栈驱动程序 HTTPS 正常运行时间警报来通知站点何时关闭,但这只会在所有 n 个 pod 都停止运行时发出警报。
是否可以创建一个堆栈驱动程序警报,当任何 n 个应用程序 pod 关闭时发出警报?
我有以下设置:
K8 Ingress --> K8 Service --> K8 Pods x n
(GCP LB for SSL) (NodePort) (containing the application)
我可以设置一个堆栈驱动程序 HTTPS 正常运行时间警报来通知站点何时关闭,但这只会在所有 n 个 pod 都停止运行时发出警报。
是否可以创建一个堆栈驱动程序警报,当任何 n 个应用程序 pod 关闭时发出警报?
首先,您应该考虑进行正确的缩放,这样您就可以完全避免在 n 个应用程序 pod 关闭时发出警报。此外,最好提醒用户遇到的症状(延迟增加或错误),而不是底层基础设施。因为如果 n 个 pod 暂时关闭可能没问题,只要用户请求仍然得到服务。话虽如此,如果您在 GKE 中运行,您可以提醒容器正常运行时间。根据您的问题,我假设情况并非如此,因此您可以: * 记录您自己的正常运行时间检查,创建日志指标并在低于某个阈值时发出警报。* 同样,创建一个自定义正常运行时间指标并对此发出警报。请注意,我会避免创建自定义指标并使用指标缺失作为警报策略条件,所以我没有 t 将其列为一个选项。HTH 并感谢您使用 Stackdriver。