0

我在 Openshift 中有一个 StatefulSet,它不断重启,但只在一个节点上。我在 POD 日志中看不到任何内容。在/var/log/messages 中,我只看到容器正在重新启动、卷已卸载等消息以及一些更神秘的消息'error: Container is already stopped''cleanup: failed to unmount secrets: invalid argument'.

但是,当我查看 StatefulSet 的 Yaml 时,我看到以下内容:

status:
  collisionCount: 1
  currentReplicas: 1

我想这才是真正的原因。
但是我怎样才能找出是什么导致了这种碰撞呢?

4

2 回答 2

1

StatefulSets通过内部执行数据快照ControllerRevisions为每个版本生成哈希

collisionCountControllerRevision明哈希冲突,可能是由于实施问题

您可以尝试通过获取控制器修订版来排除这种情况:

$ kubectl get controllerrevisions

由于这是对象的内部机制,除了重新创建对象以生成不会发生冲突的新哈希之外,几乎没有什么可做的。有一个合并的 PR表明较新的版本不应该面临这个问题。但是,您可能正在运行没有此补丁的版本。

于 2019-09-04T17:42:44.000 回答
0

您是否尝试kubectl describe pod查找事件?

于 2019-09-04T13:41:27.523 回答