Cloudera 和 Yahoo 发行版中提供了多个 Hadoop API 版本。此外,对于 Cloudera,还有 cdh3u1 到 cdh3u4 版本。
我看到 API 方法的命名方式和接受的参数也发生了变化。
哪个版本的 Hadoop API 以及从哪里可以使用最新且稳定的版本?
哪个版本的 Hadoop API 以及从哪里可以使用最新且稳定的版本?
首先要注意的是,最新和稳定的 API 不能同时使用。最新的 API 需要一些时间才能变得坚如磐石,所有的错误都被发现并修复。
如果您对打包软件感兴趣,请前往Cloudera并下载稳定版或 alpha 版并试用。对于HortonWorks,您可以下载 HDP 1.0,这是唯一可用的版本。Cloudera 定期发布 CDH 已经接近 4 年,因此相比 HortonWorks 的 HDP 更加成熟。CDH 包含了下一代 MapReduce,而 HDP 包含了传统的 MapReduce 架构。
上面提到的包(CDH 和 HDP)有一组很好的集成和测试的框架。因此,学习如何使用这些框架很重要。无需担心跨不同框架的互操作性问题。
如果您想真正了解 Hadoop,我建议您从Apache Hadoop下载该软件,然后继续安装和配置。这同样适用于 Pig、Hive 和其他软件。您可能会发现一些兼容性问题,这些问题必须在您继续进行时加以解决。
在Apache Hadoop空间中,有 1x track 具有稳定的传统 MR 架构,然后是 2x track 具有下一代 MapReduce 架构。