问题标签 [impala]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
hadoop - Tableau:使用 Impala 连接到 Cloudera Hadoop 时出错
我正在使用 Tableau 连接到 Cloudera Hadoop。我提供服务器和端口详细信息并使用“Impala”进行连接。我能够成功连接,选择默认模式并选择所需的表。
在此之后,当我将维度或度量拖放到“网格”上的行/列时,出现以下错误:
[Cloudera][Hardy] (22) 来自 ThriftHiveClient 的错误:查询返回非零代码:10025,原因:失败:SemanticException [错误 10025]:第 1:7 行表达式不在 GROUP BY 键“ <column name>
”中。
但是,如果我尝试使用与“HiveServer”(而不是“Impala”)相同的连接类型,它工作正常。我们不确定我们哪里出错了。
非常感谢您对此的任何帮助?
谢谢。
问候, 苏达卡尔
impala - 使用 Impala JDBC 驱动程序指定非默认数据库
我正在使用 Impala JDBC 驱动程序(或者我猜它实际上是 Hive Server 2 JDBC 驱动程序)。我在另一个数据库中创建了一个视图——我们称之为“store55”。
假设我的视图定义如下:
当我尝试使用 JDBC 查询此视图时,如下所示:
我收到一个错误,例如:
理想情况下,我想在 JDBC URL 中的某处或作为参数指定数据库名称,但是当我尝试使用此 JDBC url 时,我仍然收到相同的错误:
Hive2 JDBC 驱动程序是否只是忽略 URL 的数据库部分并假设所有查询都是针对默认数据库执行的?
我能够让查询返回的唯一方法是更改视图定义本身以包含数据库名称:
但是,我想保持视图定义没有数据库名称。
谢谢!
hadoop - cloudera Impalad 实例如何工作?
我正在使用 cloudera impala,我在一台机器上启动了 statestore,在所有机器节点上启动了 imapalad 实例。ipalad 和 statestore 的每个实例如何知道所有其他 impalad 实例在查询时分配负载。我已经设置了配置,但我没有在哪里指定数据节点列表供他们知道。
谢谢。
hadoop - 如何在cloudera中合并零件文件和标题
我有一个大表,它是用 Pig Editor 在 Hue 中生成的,包含大约十万条记录。Pig 返回一些部分文件和单独的 .pig_header 和 .pig_schema 文件。我需要将所有零件文件和标题作为 .txt 格式的完整表格。我可以用 getmerge 命令做到这一点:
我想问一下Cloudera中是否有任何方法可以在不使用getmerge命令的情况下获得这个完整的表?
也许 Cloudera 中有一个软件或命令允许一次组合部分文件。
然后我只需要打开这个表,所有列的标题都以“有序的方式”,什么更好地用于色调中的这个目标?
mysql - Mysql - 需要 IMPALA 查询帮助
我在 hive 有一张桌子table1
。我正在使用 impala 从表中获取数据
表的值在哪里
现在我必须从 table1 中获取数据,这样它就可以为 all 获取数据name (test1, test2, test3)
but gives only top 2 records based on amount for each name
。
提前致谢
hadoop - 通过分区控制 Impala 中的数据局部性
如果在创建表时知道理想的数据位置或布局,我想避免 Impala 节点不必要地通过网络从其他节点请求数据。这对于“非加法”操作很有帮助,其中无论如何都需要分区中的所有记录在同一位置(节点)(例如百分位数)。
是否可以告诉 Impala 分区中的所有数据都应该始终位于任何 HDFS 副本的单个节点上?
在 Impala-SQL 中,我不确定“PARTITIONED BY”子句是否提供此功能。据我了解,Impala 将其分区分块到 HDFS 上的单独文件中,但 HDFS 不保证默认情况下相关文件或块的共同位置(而是试图实现相反的效果)。
发现了一些有关 Impala 对 HDFS 开发的影响的信息,但不清楚这些信息是否已经实施或仍在计划中:
http://www.slideshare.net/deview/aaron-myers-hdfs-impala (幻灯片 23-24)
提前谢谢大家。
impala - Imapala 服务器未启动
我目前正在使用 HADOOP 2.2.0、HIVE 0.12.0 和 Impala 1.2.3。当我尝试启动 imapala -server 时,它没有启动。当我检查日志目录时,我收到以下错误。非常感谢任何帮助。
hive - 更改 Hive 表的架构
我想更改在 Hive 中创建的映射到 HBase 字段的表。最近我在 HBase 中添加了更多列,因此也希望将这些字段添加到 Hive 中。
我使用的创作:
现在我想在配置单元表 test1 中再添加一列,它应该映射到 hbase,但我找不到任何方法来做到这一点。请帮助谢谢。
mongodb - Cloudera impala 支持 mongodb 吗?
Impala 支持直接查询 Hadoop 分布式文件系统(HDFS)和 HBase(NoSQL 数据库)索引中的数据,是否支持 mongodb(NoSQL 数据库)?
hadoop - 如何跳过 impala 外部表中的文件头?
我在 HDFS 上有 78 GB 大小的文件
我需要在它上面创建一个 Impala 外部表来对可用数据执行一些分组和聚合
问题 文件包含标题。
问题 有没有办法在读取文件并查询其余数据时跳过文件中的标题。
虽然我有办法通过将文件复制到本地然后删除标题然后将更新的文件再次复制到 HDFS 来解决问题,但这不可行,因为文件大小太大
请建议是否有人有任何想法...
任何建议将不胜感激......
提前致谢