mysql - Spark：以优化方式将数据集转换为其他数据集

翻译自：https://stackoverflow.com/questions/62549717 2020-06-24T07:17:35.120

45 次

我有一个关于 Spark 操作的问题。我正在使用 Spark、Scala 和 MySQL 数据库。

我正在将表（例如 ABCTable）中的记录读入数据集 [ABCTable]。我想通过对数据集 [ABCTable] 的差异结构进行一些聚合，将数据集 [ABCTable] 转换为数据集 [PQRTable]。

如果我迭代dataset[ABCTable]我必须调用collect方法这会影响性能。

以优化方式将数据集转换为其他结构类型数据集的其他方法是什么

0 回答 0