apache-spark - 为什么最后一个执行程序计算时间在 spark sql 中需要很长时间

翻译自：https://stackoverflow.com/questions/71030633 2022-02-08T08:24:48.130

18 次

-1

在spark ui中使用spark sql，第一个任务通常很快完成，但最后一个任务需要很长时间（一个多小时）监控它，它似乎只在一个节点上工作我该如何解决？repartition 选项被慷慨地给出了，但它没有效果 sql 查询有很多 JOIN .. 有问题吗？（火花版本 2.1）

0 回答 0