0

如我所见,hadoop 的最新稳定版本是 0.20.x。最新版本是 0.23。. 似乎从 .20 开始有很多变化。至 0.23.x。

我们能够建立具有稳定版本(0.20.2)的小型集群并练习 mapreduce 编程。

我们已经看到在 0.23.x 中添加了很多新的 api。为了探索 0.23.x,我们还需要在 0.23.x 版本中设置集群。

你们能否给我们指出一个文档,我们可以在其中设置具有 0.23.x 版本的集群。

当我解压缩 tar 文件时,似乎 0.23.x 与 0.20.x 完全不同。请给我们一些书籍参考/文档,其中从一开始就提到了集群设置。

谢谢 MRK

4

2 回答 2

2

0.23 和 pre-0.23 版本之间的主要区别在于,在 0.23 中,资源管理和应用程序生命周期管理已经分离。Pre-0.23 只允许运行 MapReduce 应用程序,但 0.23 允许除 MapReduce 之外的其他应用程序。已经移植了 Hama、Giraph 和其他一些应用程序,并且 MPI 的移植正在进行中。

我们已经看到在 0.23.x 中添加了很多新的 api。为了探索 0.23.x,我们还需要在 0.23.x 版本中设置集群。

用户 API 没有任何差异,因此现有应用程序应该无需任何代码更改即可运行,但需要更改配置文件。从 API 的角度来看,0.23 版本向后兼容。

这是 MRv2 架构、视频、文章等的综合列表。当我遇到新信息时,我会尽量保持更新。

http://www.thecloudavenue.com/p/mrv2resources.html

于 2011-12-13T01:03:10.850 回答
0

这是 r0.23.0 中集群设置的官方文档:

http://hadoop.apache.org/common/docs/r0.23.0/hadoop-yarn/hadoop-yarn-site/ClusterSetup.html

于 2011-12-12T17:27:25.893 回答