对于我的用例,我有更多关于 CustomWritable 必要性的设计问题:
所以我有一个文档对,我将通过管道处理并将中间和最终数据写入 HDFS。我的密钥将类似于 ObjectId - DocId - Pair - Lang。我不明白为什么/如果我需要一个 CustomWritable 这个用例。我想如果我没有钥匙,我需要一个 CustomWritable 吗?此外,当我在 Reducer 中将数据写入 HDFS 时,我使用了自定义分区器。那么,这会消除我对自定义可写文件的需求吗?
我不确定我是否了解需要自定义可写权限的概念。有人可以指出我正确的方向吗?