2

我试图弄清楚 hadoop 的不同版本,阅读此页面后我感到困惑。

Download
1.2.X - current stable version, 1.2 release
2.2.X - current stable 2.x version
2.3.X - current 2.x version
0.23.X - similar to 2.X.X but missing NN HA.
Releases may be downloaded from Apache mirrors.

在此处输入图像描述

问题:

  1. 我认为任何以 0.xx 开头的版本都意味着它是 alpha 版本,不应在产品中使用,是这样吗?
  2. 0.23.X 和 2.3.X 有什么区别?它提到它们相似但缺少名称节点?高可用性?0.23 和 2.3 之间有什么相关性吗?是不是因为他们在开发代码的时候,PMC小组说“伙计!它太不成熟了,应该让它从0开始,因为它们是相同的产品,我会保持数字不变?”
  3. 当我查看新 hadoop 的源代码时,我发现 jobtracker 类原来是一个虚拟类。我正在设想jobtracker和tasktracker,即。Mapreduce1 将在 Hadoop 的路线图上慢慢淡出,在另一种情况下,Map Reduce Job 的接口可能保持不变,但第二代 Hadoop(YARN)将完全用 ResourceManager 取代 Jobtracker 和 Tasktracker 的想法。等等

抱歉,这个问题可能有点杂乱无章,因为我对版本号感到非常困惑。我想清楚后会修改问题。

4

2 回答 2

3

首先:Hadoop v1 和 v2(又名 YARN)之间有一个主要区别。v1 的 NameNode 和 JobTracker 被新的 ResourceManager 取代,以获得更好的可扩展性。这就是为什么两者都会在开发的后期消失。

第二:0.X 版本对 alpha 版本没有任何暗示:OpenSSL 是 0.9 版本超过十年(en.wikipedia.org/wiki/OpenSSL#Major_version_releases),尽管它被认为是事实上的标准或参考实现。许多财富 500 强公司都信任它。

Hadoop 也是如此。0.23 版本指的是具有 v2 实现的 Hadoop v1 架构(除了高可用性,因为 NameNode 仍然是 v1 的)。所以 0.23 和 2.3 大致相同,并继续并行老化。他们将其命名为 0.X,因为 1.X 已经在使用中。他们只是不希望 1.X 不断老化以表明 2.X 是要走的路——只有在依赖 1.X 的架构但另一方面希望从2.X 中的当前发展。

底部试图解释这一点,但也有一些更好的解释:http ://wiki.apache.org/hadoop/Roadmap 。这里的顶部做得更好一点: http: //hadoop.apache.org/releases.html

希望这有帮助...

于 2014-05-21T21:37:47.617 回答
1

从下图中你可以注意到 Hadoop 2.6.2 是在 2.71 之后发布的

推理 2.6 到 2.6.2是一个MINOR API 更新并且向后兼容

2.6 到 2.7主要的API 更新,例如不向后兼容。某些 API 现在可能已过时。

Hadoop 当前版本

参考Hadoop 路线图

于 2015-11-05T15:02:26.043 回答