我有这样一份 Hadoop 工作。MR 只有 map ,没有 reduce。所以设置job.setNumReduces(0)。输入文件大约300+
然后我运行作业,我只能看到 1 个地图任务正在运行。完成它大约需要 1 小时。然后我检查结果,我可以在输出文件夹中看到 300 多个结果文件。
有什么问题吗?还是它是正确的?
我真的希望 Map 应该等于输入文件的 num (而不是 1 )。我也不知道为什么输出文件 num 与输入文件 num 相同。
hadoop 作业是从 oozie 提交的。
非常感谢您的热心帮助。新松