1

使用 hadoop map reduce 在 2 个非常大的数据集上执行连接的最佳方法是什么?分布式缓存或像数组列表这样的临时存储将无法存储中间数据,因为这两个数据集都非常大。

4

0 回答 0