我浏览了很多关于 stackoverflow 的博客以及 apache wiki,以了解映射器在 Hadoop 中的设置方式。我还浏览了 [ hadoop - 如何确定总映射器[this] post。有人说它基于 InputFormat,一些帖子说它基于输入文件 id 分成的块数。
我对默认设置有些困惑。
当我运行 wordcount 示例时,我看到映射器低至 2。设置中到底发生了什么?还有这篇文章[ http://svn.apache.org/repos/asf/hadoop/common/trunk/hadoop-mapreduce-project/hadoop-mapreduce-examples/src/main/java/org/apache/hadoop/examples/ QuasiMonteCarlo.java] [示例程序]。在这里,他们根据用户输入设置映射器。如何手动进行此设置?
我非常感谢您对映射器如何工作的帮助和理解。
提前致谢