apache-spark - 范围分区器如何跨执行器处理父分区？

翻译自：https://stackoverflow.com/questions/48133702 2018-01-07T02:01:27.870

184 次

在 Apache Spark 中，分区器用于定义数据将如何被打乱。他们都有getPartition(key: Any): Int办法做到这一点。

特别是在中RangePartitioner，开发人员需要传输有关RDD启动它的信息。所以我对分区器实际上在哪里执行他们的工作感到困惑：执行器、驱动程序还是主控器？

0 回答 0