0

我今天遇到了一个奇怪的问题。首先,昨天当我离开办公室时,一切都还可以正常工作,但今天当我回去工作时,我的 DC/OS 仪表板显示我没有任何服务在运行,或者没有连接节点。

这个问题我之前也遇到过一两次,和马拉松没能选到master有关。3 个主节点之一在日志中也显示了很多错误。这可以通过停止/启动该主机上的 dcos-marathon 服务来解决,这会将其带回 marathon 组。

我确实再次看到了节点和服务。但现在它有时告诉我只有一个节点连接,然后又连接了 3 个,又只有 1 个,等等。

当我停止冲突主机上的 dcos-mesos-master 进程时,它会停止并且我有一个稳定的主集群(但​​可能不是真正有弹性)。

看起来失败的节点正试图成为主节点,这导致了这个..我试图搜索重新加入失败的 mesos-master.. 但出现了

我在 CoreOS 环境中运行 DC/OS。

4

1 回答 1

0

虽然描述了一般行为,但您可能需要提供更多细节,例如内核版本、dc/os 版本、规格等。根据给出的内容,我可以提供的最简单的答案是通过他们在 Slack 上的支持渠道联系(https://dcos-community.slack.com/)。

于 2016-08-09T03:58:27.277 回答