我们公司在cloudera上有一个9节点的集群。
我们有 41 个长期运行的 spark 流作业 [YARN + 集群模式] 和一些计划在每天下午 1 点运行的常规 spark shell 作业。
当前所有作业都以用户 A 角色提交[具有 root 权限]
我遇到的问题是,当所有 41 个 spark 流作业都在运行时,我的计划作业将无法获得资源来运行。
我已经尝试过 YARN 公平调度程序,但计划的作业仍然没有运行。
我们希望 spark 流作业始终在运行,但它会减少其他计划作业启动时占用的资源。
请随时分享您的建议或可能的解决方案。