我有一个猪作业,计划每天通过 Hadoop 作业调度程序运行。它有时可以完美运行,但偶尔会出现以下错误。每天它都会报告不同的失败原因。
第 1 天:
Error: java.io.IOException: No space left on device
第 2 天:
ENOENT: No such file or directory
第 3 天:
Lost task tracker: tracker_bos-hadoop14.co.com:localhost/127.0.0.1:48865
第 4 天:
Lost task tracker: tracker_bos-hadoop11.co.com:localhost/127.0.0.1:46408
请提出一些方法,让我的工作更可靠,更能应对这些问题。
是否有任何最佳实践来处理此类 hadoop 故障?