4

在生态系统中,hadoop我们负责管理集群中所有可用的数据,所以我的问题是什么时候生态系统下降,如何用其他数据替换和恢复它?NameNodeSecondaryNameNodeNameNodeNameNodeNameNode

4

1 回答 1

5

这里有两点需要考虑,

1- Recovery through SecondaryNameNode
2- Recovery through redundant NameNode

hadoop-1.x我们有关于 SecondaryNameNode 的概念,它包含 NameNode 元数据的副本。如果您的 NameNode 出现故障,您可以获取与 SecondaryNameNode 一起存储的元数据副本,并在您的 NameNode 再次启动后使用它来恢复您的工作。

你可以拥有hadoop-2.x(HA)超过 1 个 NameNode。如果主 NameNode 出现故障,冗余 NameNode 可以接管,这样您的集群就不会停止工作(手动或自动)。在这个实现中,有一对 NameNode 处于活动/备用配置中。如果活动名称节点发生故障,备用名称节点将接管其职责以继续为客户端请求提供服务。

为了利用 HA 功能,您应该在 HA 模式下运行 NameNodes,并使用仲裁节点或用于编辑日志事务文件的共享 HA-NFS 存储。我建议您阅读这些帖子,这些帖子精美地解释了恢复机制:

1- http://blog.cloudera.com/blog/2012/05/namenode-recovery-tools-for-the-hadoop-distributed-file-system/

2- http://blog.cloudera.com/blog/2012/10/quorum-based-journaling-in-cdh4-1/

3- http://blog.cloudera.com/blog/2012/03/high-availability-for-the-hadoop-distributed-file-system-hdfs/

但是如果你在 hadoop-1.x 上,你最好有 2 个单独的位置来存储 NameNode 元数据(机器本身的一个驱动器 + 1 个 NAS)。

高温高压

于 2013-06-30T06:01:52.340 回答