2

我了解 Apache Apex 在 Hadoop 和 YARN 上运行。它是否利用 HDFS 进行持久性和复制以防止数据丢失?还是有自己的?

4

2 回答 2

2

Apache Apex 使用操作员状态检查点来实现容错。Apex 使用 HDFS 编写这些检查点以进行恢复。但是,用于检查点的存储是可配置的。Apex 还具有到 Apache Geode 检查点的实现。Apex 还使用 HDFS 上传工件,例如包含应用程序 jar、其依赖项和配置等的应用程序包,这些是启动应用程序所需的。

于 2016-04-13T17:40:40.110 回答
1

Apache Apex 没有自己的文件系统。默认情况下,使用 Apex 编写的流应用程序将使用 HDFS 进行检查点、持久性和保存应用程序特定数据。

于 2016-04-12T08:20:17.020 回答