问题标签 [impala]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
3079 浏览

thrift - 连接错误:

我已经通过 Cloudera Manager 4.1.3 安装了 Cloudera Impala v0.4

我的集群仅包含从机

所以,我可以在这些机器上运行 impala shell——

问题是,当我运行命令时(在 slave1/slave2 中)

我收到以下错误:

这里 impalad-host 是默认在端口 no 上运行的主机名21000

如何配置主机名和端口号?

0 投票
3 回答
11034 浏览

hadoop - 拆分功能在 Cloudera Impala 中不起作用

当我尝试在 Cloudera Impala 中使用拆分功能时,我不断收到一个显示“拆分未知”的 AnalysisException。它似乎是内置功能页面上列出的有效功能。作为参考,我正在使用 Hue 与 Impala 进行交互。有谁知道这个问题的原因?

0 投票
5 回答
35313 浏览

hadoop - 与 hive 相比,impala 如何提供更快的查询响应

我最近开始研究使用 Hive 和 Impala 查询位于 HDFS 上的大量 CSV 数据。正如我所预料的那样,与 Hive 相比,对于我迄今为止使用的查询,我使用 Impala 获得了更好的响应时间。

我想知道是否有一些类型的查询/用例仍然需要 Hive 以及 Impala 不适合的地方。

对于 HDFS 上的相同数据,与 Hive 相比,Impala 如何提供更快的查询响应?

0 投票
1 回答
2499 浏览

parameters - Cloudera Impala 查询中的 SQL 参数

我有一个关于在 Impala 上运行的查询的简单问题(我使用 Pentaho 报表设计器作为我的报表工具)。查询是:

在 Pentaho Report 设计器中失败。原因是参数,因为如果我更改 where 子句,例如:a.country = 'Denmark'然后我会返回结果(准确地说,子弹很快,这就是我们想要使用它的原因)。我知道 Pentaho 想要用 来编写它的参数${},但我还没有找到有关 Impala 使用/不使用参数的信息。任何信息,想法,什么?

0 投票
1 回答
239 浏览

serialization - 将 JAXB 对象加载到 Apache Hive/Impala

考虑一个具有多个原语和集合作为成员变量的复杂 java (JAXB) 对象。Reducer 阶段将这些对象作为 < K, V > 对发送到 HDFS,其中 K 是一个 id,V 是对象的序列化形式 (SequenceFileOutputFormat)。
是否可以将这些 java 序列化对象从 HDFS/本地位置加载到 Hive/Impala?

MongoDB 能够将 JAXB 对象存储为开箱即用的 json 文档。非常感谢在 Hive 或 Impala 上实现相同目标的任何帮助。

0 投票
2 回答
7369 浏览

hadoop - 在没有 cloudera manager 的情况下安装 cloudera impala

请提供在没有 cloudera 管理器的情况下在 ubuntu 中安装 imapala 的链接。无法通过官方链接安装。

无法使用这些查询找到包 impala:

0 投票
3 回答
2751 浏览

hadoop - How to install cloudera impala on EMR?

Is there anyway i can install the only impala without cloudera manager and without cdh. I will be using the apache version of hadoop?

0 投票
4 回答
14746 浏览

hadoop - 连接错误:无法连接到 localhost:21000

我正在尝试在没有 cloudera 管理器的情况下在我的本地计算机(32 位 ubuntu)上安装 cloudera impala(它们不支持 32 位 ubuntu,我也尝试过但失败了)。

我尝试了以下命令从存储库下载 impala。

到这里为止它工作得很好。我的 impala/conf/hive-site.xml 看起来像这样

我的 impala/conf/hdfs-site.xml 看起来像这样。

现在,我试图连接到 impala-shell 上的 localhost。但是,它给了我这个错误

仅供参考,我正在使用 mysql 作为我的 hive-hadoop 集群的元存储。

0 投票
1 回答
4076 浏览

hadoop - Impala 找不到 com.mysql.jdbc.Driver

我正在尝试在 Red Hat 5 上以伪分布式模式使用 CDH4 设置 Cloudera Impala。我让 Hive 使用 JDBC 连接到 MySQL 元存储,但在使用 JDBC 设置 Impala 时遇到问题。我一直按照此处的说明进行操作:http: //www.cloudera.com/content/cloudera-content/cloudera-docs/Impala/latest/Installing-and-Using-Impala/ciiu_impala_jdbc.html

我已将 JAR 提取到一个目录并将该目录包含在$CLASSPATH. 我也包含/usr/lib/hive/lib在 中$CLASSPATH,其中有mysql-connector-java-5.1.25-bin.jar.

在我的 Hive 和 Impalaconf目录中,我hive-site.xml包含以下属性:

但是当我运行时sudo service impala-server restart,服务器日志有这个错误:

它说的原因是:

使用 JDBC 配置 Impala 是否缺少任何步骤?

0 投票
1 回答
1495 浏览

hadoop - 如何检查 impala 守护进程实例和 statestored 守护进程实例是否正在运行?

就像你启动 hadoop 或 hbase 时一样。您可以使用 jps 来检查 namenode、tasktracker 或 jobtracker 是否正在运行。是否有任何命令可以检查 impala 守护进程是否运行?