0

我是 Hadoop 新手,想知道如何写入通用输出文件以存储有关最近执行的作业的元数据。

目前,如果我正在处理文件 a、b、c 和 d ;我有一个自定义计数器,它添加了有关已处理文件数量的信息,但我想知道所有已处理的文件名。

对最好的方法有什么意见吗?分布式缓存可以提供帮助吗?

4

1 回答 1

0

Context.setStatus

会有帮助吗?

像这样使用:

Context.setStatus("Processed "+file);
于 2012-08-14T08:42:00.330 回答