我创建了一个托管配置单元表,该表存储为 ORC,并且在加载 .txt 文件时工作正常,但是无法将 ORC 文件加载到该表中。与分隔符有什么关系吗?还是我错过了什么?
问问题
4725 次
2 回答
2
下面的代码对我有用,同时将 HDFS 中的 ORC 文件加载到配置单元表中。
在 hive 中创建一个表。
create table MyDB.TEST ( Col1 String, Col2 String, Col3 String, Col4 String) STORED AS INPUTFORMAT 'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat' OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat';
将数据加载到表中。
LOAD DATA INPATH '/hdfs/dir/folder/to/orc/files/' INTO TABLE MyDB.TEST;
于 2018-02-10T04:11:06.677 回答
0
经过几次尝试,这是适合我的解决方案:
create table MyDB.TEST (
Col1 String,
Col2 String,
Col3 String,
Col4 String)
STORED AS ORC
LOCATION 'hdfs://hdfs/dir/folder/to/orc/files/';
于 2020-12-15T16:38:44.103 回答