performance - Spark UI：如何在同一执行器的核心之间平衡处理的数据量

翻译自：https://stackoverflow.com/questions/59011446 2019-11-23T19:35:34.323

34 次

1

对于 shuffle 动作，我看到同一个 executor 的核心处理的数据不平衡，当然耗时最长的会减慢整个过程的时间。

所以我想知道是否可以进行一些修改，这样数据将在核心之间平均共享。

我在 aws emr 和 s3 上使用 Spark 2.4。

0 回答 0