我是hadoop的新手。我最近阅读了有关 Apache Hadoop、Pig、Hive、HBase 的基础知识。然后我遇到了术语“Hadoop 分发”,例如 Cloudera、MAPR、HortonWorks。那么Apache Hadoop(及其回声系统)与“Hadoop Distribution”的关系是什么
它像 Java 虚拟机规范(文档)和 Oracle JVM、IBM JVM(文档的工作实现)吗?但是我们从 Apache 获得 zip,它们实际上是逻辑实现的。
所以我有点困惑。
我是hadoop的新手。我最近阅读了有关 Apache Hadoop、Pig、Hive、HBase 的基础知识。然后我遇到了术语“Hadoop 分发”,例如 Cloudera、MAPR、HortonWorks。那么Apache Hadoop(及其回声系统)与“Hadoop Distribution”的关系是什么
它像 Java 虚拟机规范(文档)和 Oracle JVM、IBM JVM(文档的工作实现)吗?但是我们从 Apache 获得 zip,它们实际上是逻辑实现的。
所以我有点困惑。
Since Hadoop is an open source project, a number of vendors have developed
their own distributions, adding new functionality or improving the code base
当然,供应商发行版旨在克服开源版本的问题并为客户提供额外价值,重点是:
可靠性:当检测到错误时,供应商的反应更快。他们及时提供修复和补丁,使他们的解决方案更加稳定。
支持:多家公司提供技术援助,这使得采用平台来处理关键任务和企业级任务成为可能。
完整性: Hadoop 发行版通常会补充其他工具来解决特定任务。
基于发行版和商业支持,以下公司提供的产品包括 Apache Hadoop、其衍生作品、商业支持和/或与 Hadoop 相关的工具和实用程序。
一些公司发布或销售包含官方 Apache Hadoop 发布文件和/或他们自己的和其他有用工具的产品。其他公司或组织发布的产品包括从 Apache Hadoop 源代码树的修改或扩展版本构建的工件。Apache 团队不支持此类衍生作品:所有支持问题都必须直接提交给供应商本身。