我正在使用标准 Apache 发行版附带的 Hadoop Map/Reduce 管理 UI。随着时间的推移,已执行的作业列表变得太大。如何从历史列表中删除旧作业?
问问题
2912 次
2 回答
1
Hadoop作业执行有生命周期,
这里解释
作业状态流程
Running -> Completed -> Retired
有一些重要的配置可以用来控制工作保留。
mapred.jobtracker.completeuserjobs.maximum: Number of jobs to keep in memory after Running state. Try configure to less value...
mapred.jobtracker.retirejob.interval: Default interval value is 24 * 60 * 60 * 1000 (1 Day). That means completed jobs will be retired after one day by default.
尝试将属性“mapred.jobtracker.retirejob.interval”配置为 1 小时左右。
于 2013-11-06T17:02:29.710 回答
0
另一个建议(更极端)只是重新启动你的 jobtracker。
于 2013-11-07T00:57:22.207 回答