嗨,我是 Hadoop 和 NoSQL 技术的新手。我开始通过读取存储在 HDFS 中的文件并处理它来学习 world-count 程序。现在我想将 Hadoop 与 MongoDB 一起使用。从这里开始程序。
现在让我感到困惑的是,它将 mongodb 数据存储在我的本地文件系统上,并在 map/reduce 中从本地文件系统读取数据到 HDFS,然后再次将其写入 mongodb 本地文件系统。在我学习HBase的时候,我们可以将其配置为将其数据存储在HDFS上,而hadoop可以直接在HDFS上进行处理(map/reduce)。如何配置 mongodb 将其数据存储在 HDFS 上。
我认为将数据存储在 HDFS 中以进行快速处理是更好的方法。不在本地文件系统中。我对吗?如果我走错方向,请清除我的概念。