我正在研究通过hadoop进行pdf文档聚类,所以我通过阅读互联网上的一些示例来学习mapreduce。在wordcount示例中有行
job.get("map.input.file")
job.getboolean()
这些函数的功能是什么?map.input.file到底是什么,它在哪里设置?还是只是输入文件夹的名称?如果有人知道,请发布答案。
有关代码,请参见以下链接 wordcount 2.0 example= http://hadoop.apache.org/docs/r1.0.4/mapred_tutorial.html