0

我已成功将 Deis 升级到 v1.0.1,具有 3 个节点集群,每个节点都有 2GB 内存,由 Digital Ocean 托管。

然后我进入deis-store-monitor服务,运行ceph -s,并意识到它已经进入active+undersized+degraded状态,并且永远不会回到active+clean状态。

详细信息如下:

root@deis-2:/# ceph -s
libust[276/276]: Warning: HOME environment variable not set. Disabling LTTng-UST per-user tracing. (in setup_local_apps() at lttng-ust-comm.c:305)
  cluster dfa09ba0-66f2-46bb-8d84-12795f281f7d
  health HEALTH_WARN 1536 pgs degraded; 1536 pgs stuck unclean; 1536 pgs undersized; recovery 1314/3939 objects degraded (33.359%)
  monmap e3: 3 mons at {deis-1=10.132.183.190:6789/0,deis-2=10.132.183.191:6789/0,deis-3=10.132.183.192:6789/0}, election epoch 28, quorum 0,1,2 deis-1,deis-2,deis-3
  mdsmap e32: 1/1/1 up {0=deis-1=up:active}, 2 up:standby
  osdmap e77: 3 osds: 2 up, 2 in
   pgmap v109093: 1536 pgs, 12 pools, 897 MB data, 1313 objects
        27342 MB used, 48256 MB / 77175 MB avail
        1314/3939 objects degraded (33.359%)
             1536 active+undersized+degraded
  client io 817 B/s wr, 0 op/s

我对ceph完全陌生。我想知道:

  • 解决这个问题有什么大不了的,还是我可以让它处于这种状态?
  • 如果建议解决此问题,您能否指出我应该如何解决?

我阅读了有关Ceph 故障排除部分POOL, PG AND CRUSH CONFIG REFERENCE的信息,但仍然不知道下一步该做什么。

非常感谢!

4

1 回答 1

1

从这个输出:osdmap e77: 3 osds: 2 up, 2 in。听起来你deis-store-daemons的一个人没有回应。deisctl restart store-daemon应该恢复你的集群,但我很好奇那个守护进程发生了什么。我很想看到journalctl --no-pager -u deis-store-daemon你所有的主机。如果您可以将日志添加到https://github.com/deis/deis/issues/2520,这将帮助我们找出守护程序没有响应的原因。

此外,DO 上的 2GB 节点可能会导致性能问题(Ceph 可能会不高兴)。

于 2014-11-22T21:42:58.663 回答