我正在研究Hadoop with MongoDB as Database
不是 HDFS。所以,我需要一些关于性能和可用性的指导。
我的场景
我的数据是
- 来自推特的推文
- Facebook 新闻提要
我可以从 twitter 和 Facebook API 获取数据。为了进行hadoop处理,我需要存储。
所以我的问题是,将 Hadoop 与 Mongo DB 一起使用来存储社交网络数据(如 Twitter 提要、Facebook 帖子等)是否可行(或有益)?还是最好使用 HDFS 并将数据存储在文件中。任何专业知识指导将不胜感激。谢谢