我正在尝试在 kubernetes 上部署高可用的 flink 集群。在下面的示例中,工作节点被复制,但我们只有一个主 pod。
https://github.com/apache/flink-statefun
据我了解,有两种方法可以使作业经理 HA。
- https://ci.apache.org/projects/flink/flink-docs-stable/ops/jobmanager_high_availability.html
- https://medium.com/hepsiburadatech/high-available-flink-cluster-on-kubernetes-setup-73b2baf9200e
在第一个示例中,我们部署另一个作业管理器以在发生故障时在它们之间切换。在第二个示例中,kubernetes 重新部署作业管理器 pod 以防发生故障
所以我有几个问题
- 对于这两个示例,当活动作业管理器失败时,正在运行的作业会发生什么情况?
- 第一个场景可以应用在 kubernetes 上吗?
对于作业管理器失败的第二种情况,flink UI 在 pod 恢复之前将不可用,但在第二种第一种情况下,它将可用,对吗?
这两种情况的优缺点是什么?