我一直在使用 S3 通过结构化流进行检查点。但是,我得到了与 S3 中的最终一致性相关的 FileNotFound 异常。
以下是我目前拥有的 S3 检查点。
val msg = testMsgs.writeStream.option("checkpointLocation",
s3://<bucket-name>/checkpoint123).foreach(writer).start
我计划在 EMR 中运行我的 spark 作业时切换到 EMRFS。
EMRFS 的可靠性如何以及如何使用 EMRFS 进行检查点?
我们实施检查点的方式会发生变化吗?
如何在 EMR 中启用 EMRFS?