0

我不确定在哪里可以问这个问题,所以我会在这里问,因为我认为这可能会为未来可能有类似问题的用户提供一个很好的参考。

Apache HAWQ ( http://hawq.incubator.apache.org/ ) 是否有任何已知的生产用途?我想将此服务与 Presto、Spark、Impala 等其他服务进行比较。但除了漂亮的基准测试之外,我还没有遇到过它的任何实际用途。最后,如果您亲自使用过它,您对它的体验如何?

4

2 回答 2

1

目前没有针对 apache hawq 的独立文档。但是社区正在将文档从关键的 hdb 转移到 apache hawq。页面上的文档链接链接到 hdb 文档(http://hdb.docs.pivotal.io/211/hdb/index.html)。你可以先参考这个,你可以在https://github.com/apache/incubator-hawq-docs找到 incubator-hawq-docs 项目。

此外,如果您不知道在哪里提问,您可以订阅开发和用户邮件列表,发送电子邮件至 dev-subscribe@hawq.incubator.apache.org / user-subscribe@hawq.incubator.apache.org 进行订阅并发送电子邮件至 dev@hawq.incubator.apache.org / user@hawq.incubator.apache.org 提出问题。

于 2017-02-04T03:29:27.177 回答
0

Pivotal HDB(HAWQ 的商业产品)在各种客户中。Hawq 是基于 MPP 历史的真正 100% SQL 兼容的 SQL 引擎。这是一个独特的产品,具有最先进的查询优化器和动态分区消除,非常强大的 HDFS 数据联合功能,具有 Hbase、Hive、JSON、ORC(beta) 和本机 hadoop 文件系统。Hawq 使用 parquet 存储格式,因此在 hawq 中创建的表可以在 Hadoop 生态系统中使用。Hawq 能够收集外部表的统计信息以更快地访问数据。支持 ACID 事务(插入)。在所有这些最引人注目的功能之上,使用 sql 中的语言扩展进行数据科学,支持 R、Python、Java、Perl。我已经在汽车、石油和天然气、物联网、医疗保健行业看到了 HAWQ 的实施。我遇到的典型用例是基于 hadoop 的 BI,数据科学模型训练和执行模型,结构化数据上的 Interactive SQL。由于 HAWQ 源于 Greenplum 传统,因此 hawq 的一些功能在竞争产品中很难找到。Hawq 完美地补充了 Hadoop 生态系统。

于 2017-02-01T02:50:14.497 回答