我搜索了许多网站和文章,但没有找到任何完美的答案。我正在使用eks 版本 1.18。我可以看到一些 pod 被“驱逐”,但在尝试检查节点时,我可以看到错误“(结合类似事件):无法垃圾收集所需数量的图像。想要释放 6283487641 字节,但已释放0 字节”。
我们有什么办法可以找到它失败的原因吗?或者如何解决这个问题?任何建议都非常受欢迎。
我可以看到磁盘“覆盖”文件系统在几个小时内几乎已满。我不确定发生了什么。下面的屏幕截图显示了我的内存利用率。
我搜索了许多网站和文章,但没有找到任何完美的答案。我正在使用eks 版本 1.18。我可以看到一些 pod 被“驱逐”,但在尝试检查节点时,我可以看到错误“(结合类似事件):无法垃圾收集所需数量的图像。想要释放 6283487641 字节,但已释放0 字节”。
我们有什么办法可以找到它失败的原因吗?或者如何解决这个问题?任何建议都非常受欢迎。
我可以看到磁盘“覆盖”文件系统在几个小时内几乎已满。我不确定发生了什么。下面的屏幕截图显示了我的内存利用率。
看看您是否可以更改 Kubernetes GC 策略。我想这些问题可能是由于最近的标志变化
新的使用标志作为--eviction
语法,你能检查一下你的设置是否是导致清除空间失败的情况
请参阅此处的文档
https://kubernetes.io/docs/concepts/cluster-administration/kubelet-garbage-collection/