我有一份工作会发出 900,000 种不同的输出。每一个都必须由一个特定的唯一名称来标识……这就是我在 mapOutputKey 上的“名称”。我如何在 map-reduce 中做到这一点?
问问题
75 次
1 回答
1
您可以使用MultipleOutputs
,在文档中您会发现几乎完全符合您需要的示例,您只需将generateFileName
函数替换为这个:
String generateFileName(K k, V v) {
return k.toString();
}
于 2014-10-10T21:26:41.307 回答