7

我正在尝试转换以关系数据库为后端的应用程序。我也可以将数据关联存储在 HDFS 中吗?

4

2 回答 2

7

只是为了存储,您可以在 HDFS 中存储任何内容。但这没有任何意义。首先,您不应将 Hadoop 视为 RDBMS 的替代品(您在此处尝试这样做)。两者都用于完全不同的目的。Hadoop 不适合您的事务、关系或实时需求。它旨在满足您的离线批处理需求。因此,最好正确分析您的用例,然后冻结您的决定。

作为一个建议,我想向您指出Hive。它在现有 Hadoop 集群之上为您提供仓储功能。它还为您的仓库提供了一个类似 SQL 的接口,如果您有 SQL 背景,这将使您的生活更加轻松。但同样,Hive 也是一个批处理系统,如果您需要实时的东西,它并不适合。

不过,按照 abhinav 的建议,您可以查看HBase 。它是一个可以在您的 Hadoop 集群上运行的数据库,并为您提供对数据的随机、实时读/写访问。但是你应该记住一件事,它是一个 NoSQL 数据库。它不遵循 SQL 术语和约定。所以,你最初可能会觉得它有点陌生。您可能需要考虑如何将数据存储在新的存储样式(列)中,这与 RDBMS 的行样式存储不同。否则设置和使用它不是问题。

高温高压

于 2013-08-05T10:06:35.257 回答
0

任何文件都可以存储在 HDFS 中。但是如果你想要一个 SQL 类型的数据库,你应该选择 HBASE。如果你直接将数据存储到 HDFS 中,你将无法存储合理性。

于 2013-08-05T09:29:41.847 回答