0

现在我已经设置了我的 Hadoop 集群、HBase 和 Hive。下一步我想设置 Cloudera Impala 从 HBase 或 HDFS 查询数据。我从互联网上搜索,但找不到关于如何在 HSDFS 和 HBase(可能在 Hive 之上)上设置 Cloudera Impala 的清晰易懂的说明,谁能给我一个关于在 HDFS 上设置和配置 Cloudera Impala 的指南和 HBase?

4

1 回答 1

3

首先,从您的问题中不清楚您是否安装了 CDH 或股票 Apache Hadoop、HBase 等。这很重要——尽管理论上它可以在现有的 Hadoop 上运行,但 Impala 仅在 CDH 上进行了测试和支持。

如果您没有安装 Impala 或 CDH,到目前为止,最简单的方法是通过 Cloudera Manager,它将自动安装/部署 CDH/Impala 集群。Cloudera Express,它是免费的,包括你需要做的一切。您可以选择自动安装单个软件包,或者下载一系列 Linux 软件包。此处详细描述了这些选项。

或者,如果您只是在寻找演示,请下载并安装 QuickStart VM,其中包含单节点集群(包括 CDH + Impala)、来宾操作系统和数据/脚本/示例。

可以在此处找到上述任何内容的下载。

于 2013-10-11T22:13:06.283 回答