(来自 Hadoop 新手)
我想在玩具 Hadoop 概念验证示例中尽可能避免使用文件。我能够从非基于文件的输入中读取数据(感谢http://codedemigod.com/blog/?p=120)——它会生成随机数。
我想将结果存储在内存中,以便可以对其进行进一步的(非 Map-Reduce)业务逻辑处理。基本上:
conf.setOutputFormat(InMemoryOutputFormat)
JobClient.runJob(conf);
Map result = conf.getJob().getResult(); // ?
似乎做我想做的最接近的事情是以二进制文件输出格式存储结果,并用等效的输入格式将其读回。这似乎是不必要的代码和不必要的计算(我是否误解了 Map Reduce 所依赖的前提?)。