我正在运行一个基本上是这样的代码:
Create table abc as
select A.* from
table1 A
Left outer join
table2 B
on
A.col1=B.col1 and A.col2=B.col2;
table1的记录数=7009102 table2的记录数=1787493
我的脚本中有类似的 6 个查询,但我的脚本卡在第 4 个这样的查询上。我尝试通过 tez 和 mapreduce 运行,但两者都有相同的问题。
在 mapreduce 中,它卡在 map 0% 并且即使在一小时后也减少了 0%。Tez 中没有减速器,1 小时内只有 22%。
检查日志后,它会显示许多条目,例如“TaskAttempt attempt_12334_m_000003_0 的进度是:0.0”。
我在 tez 中运行了这项工作,现在已经将近 3 个小时了,这项工作即将完成,其中 2 次在 Map-2 Vertice 中失败。