1

ORC 文件格式可以在 Impala 中使用吗?还如何访问存储在 Impala 的 hive 元存储中的 ORC 表。在文档链接下方找到,但它不包含任何受限制的文件格式列表或提及 impala 不支持的 ORC:http: //www.cloudera.com/documentation/enterprise/latest/topics/impala_file_formats.html

4

4 回答 4

3

Impala 不支持 ORC。相反,Apache Parquet 是获得最佳性能的推荐格式。

于 2016-05-11T17:44:55.113 回答
0

尽管 ORC 是 Hive 中唯一支持 ACID 功能的格式,并且在一些基准测试研究中表现出更好的查询性能和压缩率,但 Impala 不支持 ORC 文件格式,因为它是由 Hortonworks 创建的,后者是其主要竞争对手之一。反之亦然,Hortonworks 数据平台 (HDP) 上的 Hive 版本不支持 Parquet,原因相同。

于 2017-04-08T04:02:43.650 回答
0

使用以下命令在 impala 中创建 orc 格式表:

create table orc_table_name_1 (x INT, y STRING) STORED AS orc;
于 2019-01-10T09:59:37.643 回答
0

Impala 无法读取 ORC 文件格式。如果您有可能,我建议您使用 Hive 将您的 ORC 文件迁移到 PARQUET。优点是您只需支付一次设置 map-reduce 任务的费用。

如果您的 ORC 表是 nameoforctable,则一个非常基本的查询如下所示:

CREATE TABLE nameoforctable_parquet
LIKE nameoforctable
STORED AS PARQUET
LOCATION '/your/hdfs/location';

INSERT INTO nameoforctable_parquet 
SELECT * FROM nameoforctable
于 2016-06-09T22:37:44.810 回答