0

Flink 文档说“当运行一个高可用的 YARN 集群时,我们不会运行多个 JobManager (ApplicationMaster) 实例,而是只运行一个,它会在失败时由 YARN 重新启动。”。然后在“高可用性:zookeeper”下方。

我没有使用纱线的经验,但是如果纱线负责重启并且我们只有一个 JobManager,为什么我们需要设置 Zookeeper?或者这是资源管理器的动物园管理员?

4

2 回答 2

1

为了确保“高可用性”,通常建议使用基于 Zookeeper 的 YARN 实现。使用 YARN,只有一个 RessourceManager 实例运行,基于 Zookeeper 的实现为 RessourceManager 提供了高可用性,当活动的一个实例崩溃时,它允许 RessourceManager 故障转移到另一个实例。

此实现通过将 RessourceManager 的当前内部状态存储在 Zookeeper 中来工作。

资料来源:Apache Zookeeper Essentials,Saurav Haloi

于 2017-04-03T08:24:59.570 回答
0
  1. YARN 本身可以自动重启一个新的 ApplicationMaster 容器,因为 ApplicationMaster 和 JobManager 运行在同一个进程中,所以 JobManager 可以自动重启。

  2. 这里的 Zookeeper 是用来恢复之前宕机的 Job Manager 的状态,比如 checkpoint 信息。

于 2019-10-19T02:22:12.927 回答