1

我已经在我的集群上安装了 hadoop 1.0.4,有 1 个主节点和 3 个从节点,现在我想通过我的 Web 应用程序访问我的 HDFS 文件系统,以存储和访问现有 Web 应用程序的数据。

由于我的 Web 应用程序当前使用 MySQL 作为数据库,我想用 HDFS 替换它。

那么可以使用什么,以便我能够通过现有的 Web 应用程序访问 HDFS?

出于后端数据迁移的目的,我使用的是 sqoop 和 flume,但我希望应用程序与 HDFS 实时同步。因为我从网页保存的应该直接去HDFS,而我想要搜索的应该直接来自HDFS。

请建议。

提前致谢。

4

1 回答 1

2

这就像用橙子代替苹果。

你不能用 HDFS 代替 MySQL。MySQL 是数据库,而 HDFS 是类似 ext3/ext4 的文件系统。HDFS 以分布式方式运行,而 ext3/ext4 不会。

HDFS 提供高延迟和高吞吐量,而 MySQL 数据库提供低延迟和低吞吐量。考虑用 NoSQL DB(Cassandra、HBase 等)替换 RDBMS(MySQL、Oracle 等)。

有大量 NoSQL 数据库,根据需求分析,必须选择合适的数据库。

于 2013-03-23T06:21:04.040 回答