让我们考虑一个生成 1000 个地图任务的 MapReduce 作业。块大小:128MB 最小分割大小:1MB 最大分割大小:256MB
块大小似乎是极限值。我们可以将分割大小增加到块大小之外吗?
这是 FileInputFormat.java 中的一个函数
protected long computeSplitSize(long goalSize, long minSize, long blockSize) {
return Math.max(minSize, Math.min(goalSize, blockSize));
}
基于上述函数最小分割大小大于块大小将做我想要的。有人可以阐明以这种方式设置最小拆分大小的任何副作用吗?