亲爱的 Apache Spark 爱好者
我最近启动了一个副业项目,目标是将几台 ODROID XU4 计算机变成一个独立的 Spark 集群。
设置集群后,我遇到了一个似乎特定于异构多处理器的问题。当使用全部 8 个处理器时,Spark 执行器任务在 XU4 上运行非常缓慢。正如我在下面的帖子的评论中提到的那样,原因是 Spark 不会等待已在慢速处理器上启动的执行程序。
一种解决方案是使用更少的执行器核心并将 CPU 亲和性设置为不使用 LITTLE 处理器。然而,这不是理想的解决方案。
有没有办法让 Spark 等待更长时间以获得较慢执行者的反馈?显然等待太久会对性能产生负面影响。然而,利用所有核心的积极影响应该抵消消极影响。
提前感谢您的帮助!