问题标签 [impala]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
thrift - 连接错误:
我已经通过 Cloudera Manager 4.1.3 安装了 Cloudera Impala v0.4
我的集群仅包含从机
所以,我可以在这些机器上运行 impala shell——
问题是,当我运行命令时(在 slave1/slave2 中)
我收到以下错误:
这里 impalad-host 是默认在端口 no 上运行的主机名21000
。
如何配置主机名和端口号?
hadoop - 拆分功能在 Cloudera Impala 中不起作用
当我尝试在 Cloudera Impala 中使用拆分功能时,我不断收到一个显示“拆分未知”的 AnalysisException。它似乎是内置功能页面上列出的有效功能。作为参考,我正在使用 Hue 与 Impala 进行交互。有谁知道这个问题的原因?
hadoop - 与 hive 相比,impala 如何提供更快的查询响应
我最近开始研究使用 Hive 和 Impala 查询位于 HDFS 上的大量 CSV 数据。正如我所预料的那样,与 Hive 相比,对于我迄今为止使用的查询,我使用 Impala 获得了更好的响应时间。
我想知道是否有一些类型的查询/用例仍然需要 Hive 以及 Impala 不适合的地方。
对于 HDFS 上的相同数据,与 Hive 相比,Impala 如何提供更快的查询响应?
parameters - Cloudera Impala 查询中的 SQL 参数
我有一个关于在 Impala 上运行的查询的简单问题(我使用 Pentaho 报表设计器作为我的报表工具)。查询是:
在 Pentaho Report 设计器中失败。原因是参数,因为如果我更改 where 子句,例如:a.country = 'Denmark'
然后我会返回结果(准确地说,子弹很快,这就是我们想要使用它的原因)。我知道 Pentaho 想要用 来编写它的参数${}
,但我还没有找到有关 Impala 使用/不使用参数的信息。任何信息,想法,什么?
serialization - 将 JAXB 对象加载到 Apache Hive/Impala
考虑一个具有多个原语和集合作为成员变量的复杂 java (JAXB) 对象。Reducer 阶段将这些对象作为 < K, V > 对发送到 HDFS,其中 K 是一个 id,V 是对象的序列化形式 (SequenceFileOutputFormat)。
是否可以将这些 java 序列化对象从 HDFS/本地位置加载到 Hive/Impala?
MongoDB 能够将 JAXB 对象存储为开箱即用的 json 文档。非常感谢在 Hive 或 Impala 上实现相同目标的任何帮助。
hadoop - 在没有 cloudera manager 的情况下安装 cloudera impala
请提供在没有 cloudera 管理器的情况下在 ubuntu 中安装 imapala 的链接。无法通过官方链接安装。
无法使用这些查询找到包 impala:
hadoop - How to install cloudera impala on EMR?
Is there anyway i can install the only impala without cloudera manager and without cdh. I will be using the apache version of hadoop?
hadoop - 连接错误:无法连接到 localhost:21000
我正在尝试在没有 cloudera 管理器的情况下在我的本地计算机(32 位 ubuntu)上安装 cloudera impala(它们不支持 32 位 ubuntu,我也尝试过但失败了)。
我尝试了以下命令从存储库下载 impala。
到这里为止它工作得很好。我的 impala/conf/hive-site.xml 看起来像这样
我的 impala/conf/hdfs-site.xml 看起来像这样。
现在,我试图连接到 impala-shell 上的 localhost。但是,它给了我这个错误
仅供参考,我正在使用 mysql 作为我的 hive-hadoop 集群的元存储。
hadoop - Impala 找不到 com.mysql.jdbc.Driver
我正在尝试在 Red Hat 5 上以伪分布式模式使用 CDH4 设置 Cloudera Impala。我让 Hive 使用 JDBC 连接到 MySQL 元存储,但在使用 JDBC 设置 Impala 时遇到问题。我一直按照此处的说明进行操作:http: //www.cloudera.com/content/cloudera-content/cloudera-docs/Impala/latest/Installing-and-Using-Impala/ciiu_impala_jdbc.html
我已将 JAR 提取到一个目录并将该目录包含在$CLASSPATH
. 我也包含/usr/lib/hive/lib
在 中$CLASSPATH
,其中有mysql-connector-java-5.1.25-bin.jar
.
在我的 Hive 和 Impalaconf
目录中,我hive-site.xml
包含以下属性:
但是当我运行时sudo service impala-server restart
,服务器日志有这个错误:
它说的原因是:
使用 JDBC 配置 Impala 是否缺少任何步骤?
hadoop - 如何检查 impala 守护进程实例和 statestored 守护进程实例是否正在运行?
就像你启动 hadoop 或 hbase 时一样。您可以使用 jps 来检查 namenode、tasktracker 或 jobtracker 是否正在运行。是否有任何命令可以检查 impala 守护进程是否运行?