hadoop - Namenode 恢复，namenode 恢复是如何工作的？

Question

在生态系统中，hadoop我们负责管理集群中所有可用的数据，所以我的问题是什么时候生态系统下降，如何用其他数据替换和恢复它？NameNodeSecondaryNameNodeNameNodeNameNodeNameNode

score 5 · Accepted Answer

这里有两点需要考虑，

1- Recovery through SecondaryNameNode
2- Recovery through redundant NameNode

在hadoop-1.x我们有关于 SecondaryNameNode 的概念，它包含 NameNode 元数据的副本。如果您的 NameNode 出现故障，您可以获取与 SecondaryNameNode 一起存储的元数据副本，并在您的 NameNode 再次启动后使用它来恢复您的工作。

你可以拥有hadoop-2.x(HA)超过 1 个 NameNode。如果主 NameNode 出现故障，冗余 NameNode 可以接管，这样您的集群就不会停止工作（手动或自动）。在这个实现中，有一对 NameNode 处于活动/备用配置中。如果活动名称节点发生故障，备用名称节点将接管其职责以继续为客户端请求提供服务。

为了利用 HA 功能，您应该在 HA 模式下运行 NameNodes，并使用仲裁节点或用于编辑日志事务文件的共享 HA-NFS 存储。我建议您阅读这些帖子，这些帖子精美地解释了恢复机制：

1- http://blog.cloudera.com/blog/2012/05/namenode-recovery-tools-for-the-hadoop-distributed-file-system/

2- http://blog.cloudera.com/blog/2012/10/quorum-based-journaling-in-cdh4-1/

3- http://blog.cloudera.com/blog/2012/03/high-availability-for-the-hadoop-distributed-file-system-hdfs/

但是如果你在 hadoop-1.x 上，你最好有 2 个单独的位置来存储 NameNode 元数据（机器本身的一个驱动器 + 1 个 NAS）。

高温高压

hadoop - Namenode 恢复，namenode 恢复是如何工作的？

1 回答 1

Related

Reference