我试图弄清楚 hadoop 的不同版本,阅读此页面后我感到困惑。
Download
1.2.X - current stable version, 1.2 release
2.2.X - current stable 2.x version
2.3.X - current 2.x version
0.23.X - similar to 2.X.X but missing NN HA.
Releases may be downloaded from Apache mirrors.
问题:
- 我认为任何以 0.xx 开头的版本都意味着它是 alpha 版本,不应在产品中使用,是这样吗?
- 0.23.X 和 2.3.X 有什么区别?它提到它们相似但缺少名称节点?高可用性?0.23 和 2.3 之间有什么相关性吗?是不是因为他们在开发代码的时候,PMC小组说“伙计!它太不成熟了,应该让它从0开始,因为它们是相同的产品,我会保持数字不变?”
- 当我查看新 hadoop 的源代码时,我发现 jobtracker 类原来是一个虚拟类。我正在设想jobtracker和tasktracker,即。Mapreduce1 将在 Hadoop 的路线图上慢慢淡出,在另一种情况下,Map Reduce Job 的接口可能保持不变,但第二代 Hadoop(YARN)将完全用 ResourceManager 取代 Jobtracker 和 Tasktracker 的想法。等等
抱歉,这个问题可能有点杂乱无章,因为我对版本号感到非常困惑。我想清楚后会修改问题。