我是 Hadoop、HBase 和 Hive 的新手。我以伪分布式模式安装了 Hadoop、HBase 和 Hive,一切正常。现在我打算用 Hive、HBase 和 ZooKeeper 建立一个简单的 Hadoop 集群(5 个节点)。我之前已经阅读了一些文档和说明,但我找不到我的问题的一个很好的解释。我不确定在哪里运行所有守护进程。这是我的考虑:
节点_1(主)
名称节点
作业追踪器
HBase 大师
ZooKeeper(独立节点;由 HBase 管理)
Node_2 (Backup_Master)
次要名称节点
Node_3 (Slave1)
数据节点1
任务跟踪器1
区域服务器1
Node_4 (Slave2)
数据节点2
任务跟踪器2
区域服务器2
Node_5 (Slave3)
- 数据节点3
- 任务跟踪器3
- 区域服务器3
我知道,在生产中,建议在奇数个节点(单独的集群)上运行 ZooKeeper 集成。但是对于一个简单的集群,是否可以设置一个独立的 ZooKeeper 节点运行在主节点上?
另一个问题是关于 Hive:我知道 Hive 是一个 Hadoop 客户端。我还应该在主节点上安装 Hive 吗?是否有意义?
感谢所有提示和评论!哈坎
注意:我只有 5 台机器来模拟集群。