ceph - Deis 安装后 Ceph 进入降级状态

Question

我已成功将 Deis 升级到 v1.0.1，具有 3 个节点集群，每个节点都有 2GB 内存，由 Digital Ocean 托管。

然后我进入deis-store-monitor服务，运行ceph -s，并意识到它已经进入active+undersized+degraded状态，并且永远不会回到active+clean状态。

详细信息如下：

root@deis-2:/# ceph -s
libust[276/276]: Warning: HOME environment variable not set. Disabling LTTng-UST per-user tracing. (in setup_local_apps() at lttng-ust-comm.c:305)
  cluster dfa09ba0-66f2-46bb-8d84-12795f281f7d
  health HEALTH_WARN 1536 pgs degraded; 1536 pgs stuck unclean; 1536 pgs undersized; recovery 1314/3939 objects degraded (33.359%)
  monmap e3: 3 mons at {deis-1=10.132.183.190:6789/0,deis-2=10.132.183.191:6789/0,deis-3=10.132.183.192:6789/0}, election epoch 28, quorum 0,1,2 deis-1,deis-2,deis-3
  mdsmap e32: 1/1/1 up {0=deis-1=up:active}, 2 up:standby
  osdmap e77: 3 osds: 2 up, 2 in
   pgmap v109093: 1536 pgs, 12 pools, 897 MB data, 1313 objects
        27342 MB used, 48256 MB / 77175 MB avail
        1314/3939 objects degraded (33.359%)
             1536 active+undersized+degraded
  client io 817 B/s wr, 0 op/s

我对ceph完全陌生。我想知道：

解决这个问题有什么大不了的，还是我可以让它处于这种状态？
如果建议解决此问题，您能否指出我应该如何解决？

我阅读了有关Ceph 故障排除部分和POOL, PG AND CRUSH CONFIG REFERENCE的信息，但仍然不知道下一步该做什么。

非常感谢！

score 1 · Accepted Answer

从这个输出：osdmap e77: 3 osds: 2 up, 2 in。听起来你deis-store-daemons的一个人没有回应。deisctl restart store-daemon应该恢复你的集群，但我很好奇那个守护进程发生了什么。我很想看到journalctl --no-pager -u deis-store-daemon你所有的主机。如果您可以将日志添加到https://github.com/deis/deis/issues/2520，这将帮助我们找出守护程序没有响应的原因。

此外，DO 上的 2GB 节点可能会导致性能问题（Ceph 可能会不高兴）。

ceph - Deis 安装后 Ceph 进入降级状态

1 回答 1

Related

Reference