2

我们有 5 TB 的 mongodb 数据,我们的客户想要迁移到 Hadoop 并使用 Hadoop 处理数据。

我们的要求是将数据从 MongoDB 加载到 HDFS 并对其进行处理并存储到另一个随机访问数据库中。

我们(团队)的想法是使用 mongo-hadoop 驱动程序将数据从 mongoDB 加载到 HDFS,并使用 HIVE 对其进行处理,并将数据加载到 HBASE 以进行随机访问。

那么,有没有其他更好的方法来做到这一点。请提供您的建议。

仅供参考:我们有 20 个节点集群。

4

0 回答 0