Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我是 Hadoop 新手,想知道如何写入通用输出文件以存储有关最近执行的作业的元数据。
目前,如果我正在处理文件 a、b、c 和 d ;我有一个自定义计数器,它添加了有关已处理文件数量的信息,但我想知道所有已处理的文件名。
对最好的方法有什么意见吗?分布式缓存可以提供帮助吗?
Context.setStatus
会有帮助吗?
像这样使用:
Context.setStatus("Processed "+file);