在一个 reduce-only Hadoop 作业中,输入文件由身份映射器处理,并在不修改的情况下发送到 reducer。在我的一些工作中,我很惊讶地看到该工作在映射阶段失败,出现“内存不足错误”和“超出 GC 开销限制”。
据我了解,身份映射器上的内存泄漏是不可能的。这种错误的原因是什么?
在一个 reduce-only Hadoop 作业中,输入文件由身份映射器处理,并在不修改的情况下发送到 reducer。在我的一些工作中,我很惊讶地看到该工作在映射阶段失败,出现“内存不足错误”和“超出 GC 开销限制”。
据我了解,身份映射器上的内存泄漏是不可能的。这种错误的原因是什么?