在 Hadoop 中,我可以轻松创建 Map/Reduce 应用程序来访问和处理大型文本文件和 csv 文件中的数据。我的问题是 Hbase 可以做同样的事情并访问这么大的文件,还是 HBase 有其他用途?
Hbase 像关系数据库一样运行查询;所以,我很难理解 HBase 的优势,除非它可以像 Hadoop 一样访问巨大的文本和 csv 文件。
首先,Hbase 只是一个商店。商店从不访问任何东西。相反,您访问商店以获取或放置数据。与任何其他数据存储一样,Hbase 只有一项工作要做,即存储您的数据并在您需要时提供给您。您可以编写 MapReduce 作业或顺序 Java 程序等以将数据放入 Hbase 或从中获取数据。你喜欢哪条路完全取决于你。
谈到问题的第二部分,Hbase 从来没有像传统的关系数据库那样工作。从存储数据到访问数据,一切都是完全不同的。使用 Hbase 的优点是您可以将非常大量的数据存储到其中并具有随机读/写访问权限。数据可以是任何类型,即。text, csv, tsv, binary 等。但是,在继续之前,您必须先考虑 Hbase 是否适合您,因为一种尺寸并不适合所有人。
高温高压