1

我在 Ubuntu 14.04 上的 3 台主机上使用 mesosphere,如下所示:

  • 一位与 mesos 大师
  • 两个与 mesos 奴隶

一切正常,但重新启动所有物理主机后,所有计划的作业都丢失了。这是正常的?我预计zookeeper将存储当前的作业,然后当系统需要重新启动它时,所有作业将在主引导后重新安排。

更新: 我在同一个节点上使用 marathon 和 mesos,并且我正在运行带有标志--zk的 marathon

4

3 回答 3

0

启用marathon--zk--ha,Marathon 应该将其状态存储在 ZK 中并在重新启动时恢复它,只要 Mesos 允许它使用相同的框架 ID 重新注册。

但是,您还需要启用 Mesos 注册表(即使对于单个主服务器),以确保 Mesos 持久保存有关在主故障转移事件中注册了哪些 frameworkId 的信息。这可以通过设置--registry=replicated_log(默认)、--quorum=1(因为您只有 1 个主控)和--work_dir=/path/to/registry(存储状态的位置)来完成。

于 2015-02-09T22:06:42.400 回答
0

尽管您找到了解决方案,但我想对此问题进行更多解释:)

官方文档:<a href="http://mesos.apache.org/documentation/latest/slave-recovery/" rel="nofollow">http://mesos.apache.org/documentation/latest/slave-恢复/

请注意,如果从属设备上的操作系统重新启动,则主机上运行的所有执行程序和任务都将被杀死,并且不会在主机恢复时自动重新启动。

因此,Mesos 上的所有框架都将在重启后被杀死。重新启动框架的一种方法是在 Marathon 上运行所有框架,这将管理其他框架并在需要时重新启动它们。

但是,您需要在 Marathon 被杀死时自动重新启动它。在您提到的 digitialocean 链接中,Marathon 是使用 init.d 中的脚本安装的,因此可以在重新启动后重新启动。否则,如果您通过源代码安装 Marathon,则可以使用 supervisord 等工具来监控 Marathon。

于 2016-05-13T09:14:12.540 回答
0

我按照此安装说明解决了问题:How To Configure a Production-Ready Mesosphere Cluster on Ubuntu 14.04

于 2015-10-09T12:51:25.360 回答