我有一个涉及 kubernetes 插件的 Jenkins 部署管道。使用 kubernetes 插件,我创建了一个从属 pod,用于使用yarn构建节点应用程序。设置了 CPU 和内存的请求和限制。
当 Jenkins master 调度 slave 时,有时(因为我还没有看到模式,到目前为止),pod 使整个节点无法访问并将节点的状态更改为未知。在 Grafana 中仔细检查后,CPU 和内存资源似乎在范围内,没有明显的峰值。发生的唯一峰值是磁盘 I/O,峰值达到 ~ 4 MiB。
我不确定这是否是节点无法将自己定位为集群成员的原因。我在这里需要一些帮助:
a) 如何深入诊断节点离开集群的原因。
b) 如果原因是磁盘 IOPS,Kubernetes 级别是否有任何默认请求和 IOPS 限制?
PS:我正在使用 EBS (gp2)