您好,我需要在映射器中抛出异常并将该错误打印到 HDFS 中的文件中吗?
我不希望整个工作失败。具有错误文件的映射器应该抛出异常,并且应该将错误写入 HDFS 中的文件。
我应该如何实现这个?
您好,我需要在映射器中抛出异常并将该错误打印到 HDFS 中的文件中吗?
我不希望整个工作失败。具有错误文件的映射器应该抛出异常,并且应该将错误写入 HDFS 中的文件。
我应该如何实现这个?
如果您在映射器中捕获异常,我认为应该没有问题。在 catch 代码中你可以创建一个文件 HDFS. 更多关于将数据写入 HDFS 的信息可以在这篇讨论FileSystem
类的帖子中找到:链接到在 MRjob 中存储文件
这里还有一个关于 java 中异常处理的链接:Catching exception and continue processing