我正在“本地”模式下运行 spark 应用程序。它正确地检查点到 checkpointFolder 配置中定义的目录。但是,我看到有两个问题会导致一些磁盘空间问题。
1)由于我们有多个用户运行应用程序,服务器上的检查点文件夹是由第一个执行它的用户创建的,这导致其他用户的运行由于操作系统上的权限问题而失败。有没有办法在 checkpointFolder 中提供相对路径,例如 checkpointFolder=~/spark/checkpoint?
2) 我使用 spark.worker.cleanup.enabled=true 配置在运行后清理检查点文件夹,但没有看到这种情况发生。有没有通过应用程序清理它的替代方法,而不是求助于一些 cron 工作?