5

HBase的最小服务器组成是多少?

全分布式,使用分片,但不使用 Hadoop。用于生产环境。

我期待着这样解释。

  • 服务器 1:动物园管理员

  • 服务器 2:区域服务器

    ... 和更多

谢谢你。

4

1 回答 1

12

最小值是 one-see伪分布式模式。涉及的运动部件是:

假设您在 HDFS 上运行(您应该这样做):

  1. 1个HDFS名称节点
  2. 1 个或多个 HDFS 辅助 NameNode
  3. 1 个或多个 HDFS 数据节点

对于 MapReduce(如果需要):

  1. 1 MapReduce JobTracker
  2. 1 个或多个 MapReduce TaskTracker(s)(通常与数据节点相同的机器)

对于 HBase 本身

  1. 1 个或多个 HBase Master(s)(热备份是个好主意)
  2. 1 个或多个 HBase RegionServer(s)(通常与数据节点相同的机器)
  3. 1 个或多个 Thrift 服务器(如果您需要从它所在的网络外部访问 HBase)

对于动物园管理员

  1. 3 - 5 个 ZooKeeper 节点

您需要的机器数量实际上取决于您在面对硬件故障时需要多少可靠性以及对于什么样的节点。面对硬件故障时,上述唯一(尚)不支持热故障转移或其他恢复的节点是 HDFS NameNode,尽管在最近的 Hadoop 版本中已修复此问题。

您通常希望将 RegionServers 的 HDFS 复制因子设置为 3,以便您可以利用机架感知

因此,经过长时间的谩骂,我至少建议(对于生产部署):

  • 1x HDFS NameNode
  • 1x JobTracker / 辅助 NameNode
  • 3x ZK 节点
  • 3x DataNode / RegionServer 节点(如果你想运行 MapReduce,TaskTracker)
  • 1x Thrift 服务器(仅当从运行它的网络外部访问 HBase 时)
于 2012-02-22T17:09:06.960 回答