3

我是hadoop的新手。我最近阅读了有关 Apache Hadoop、Pig、Hive、HBase 的基础知识。然后我遇到了术语“Hadoop 分发”,例如 Cloudera、MAPR、HortonWorks。那么Apache Hadoop(及其回声系统)与“Hadoop Distribution”的关系是什么

它像 Java 虚拟机规范(文档)和 Oracle JVM、IBM JVM(文档的工作实现)吗?但是我们从 Apache 获得 zip,它们实际上是逻辑实现的。

所以我有点困惑。

4

2 回答 2

4
Since Hadoop is an open source project, a number of vendors have developed 
their own distributions, adding new functionality or improving the code base

当然,供应商发行版旨在克服开源版本的问题并为客户提供额外价值,重点是:

可靠性:当检测到错误时,供应商的反应更快。他们及时提供修复和补丁,使他们的解决方案更加稳定。

支持:多家公司提供技术援助,这使得采用平台来处理关键任务和企业级任务成为可能。

完整性: Hadoop 发行版通常会补充其他工具来解决特定任务。

看看这篇顶级Hadoop 发行版文章和这篇 关于三大 Hadoop 发行版之间的基准测试分析的演示文稿。

于 2016-02-20T12:36:13.600 回答
2

基于发行版和商业支持,以下公司提供的产品包括 Apache Hadoop、其衍生作品、商业支持和/或与 Hadoop 相关的工具和实用程序。

一些公司发布或销售包含官方 Apache Hadoop 发布文件和/或他们自己的和其他有用工具的产品。其他公司或组织发布的产品包括从 Apache Hadoop 源代码树的修改或扩展版本构建的工件。Apache 团队不支持此类衍生作品:所有支持问题都必须直接提交给供应商本身。

于 2016-02-20T10:17:15.100 回答