据我所知,我只知道 Hadoop 1 和 2 之间的一个区别。
它的主动和被动辅助名称节点。
有人可以列出 Hadoop 1 和 2 之间的区别吗?
Hadoop 1
Hadoop 2
Hadoop2 中的 Hadoop 架构有重大改进。引入了称为 YARN(Yet Another Resource Negotiator)的分布式操作系统层。现在资源(内存和 CPU)管理由 YARN 处理。
此外,还为 NameNode 引入了 HA。
1) 可扩展性 - 通过将处理在从属上运行的任务的工作委托给应用程序主控来减少资源管理器 (RM) 的负载,RM 现在可以处理比作业跟踪器更多的请求,从而促进添加更多节点。
2) 与 MPv1 与 MapReduce 强耦合不同,YARN 支持在其上运行多种代码,如 MR2、Tez、Storm、Spark 等
3)优化的资源分配——YARN中没有为Mapper和Reducers单独分配固定数量的slot,MRv1就是这种情况。因此,节点的可用容量可以用于任何需要资源的任务。
4) 当资源管理器发生故障时,在资源管理器恢复后,集群上运行的作业无需重新启动。
5) 故障转移机制由 ZK 实现,它已经是资源管理器的一部分,它说,我们不需要运行另一个守护进程。