我开始学习 hbase,但我不明白它是如何线性扩展的。
问题是在安装 hbase 之前,您必须拥有一个 hdfs 集群。HDFS集群有一个master节点,在整个集群中只能是一个,所以它是一个瓶颈。当然,我们可以再运行 1 个主节点(也可以只运行 1 个主节点),但它将处于备用状态。据我了解,hbase 使用 HDFS 集群来存储数据。所以,对我来说,运行多个 Hmaster 从逻辑上讲是没有意义的,因为所有请求都将发送到 hdfs 活动 master,如果我们有太多请求,性能会受到影响。
另外我不明白我们是否需要将 hbase 安装在具有 hdfs 的相同节点上或单独安装。如果我们将 hbase 与 HDFS 分开运行有什么好处。对我来说,在逻辑上使用 hdfs 将 hbase 集群安装在相同的节点上,如下例所示:
HDFS active master - HMaster
HDFS standby master - HMaster backup
HDFS Data node - HRegion server
对我来说,这是最合乎逻辑的结构,因为如果我们将 hdfs master 与 hmaster 分开,那么松散 hbase 集群的概率将大两倍。
如果有人可以分享有关所有这些东西的信息,我将非常高兴。因为我真的不明白 hbase 是如何线性扩展的,以及它是如何与 hdfs 一起工作的。