0

我正在尝试加入 hive 中的两个大表。即使我将减速器的数量设置为 500,连接也只发生在最后一个减速器上。由于那个工作被杀死。我知道相同的密钥用于相同的减速器。在这两个表中,都有许多唯一键。你能告诉我如何解决这个问题吗?你也可以告诉我为什么 map reduce 需要最后一个 reducer 来执行连接。

4

0 回答 0