2

我创建了一个托管配置单元表,该表存储为 ORC,并且在加载 .txt 文件时工作正常,但是无法将 ORC 文件加载到该表中。与分隔符有什么关系吗?还是我错过了什么?

4

2 回答 2

2

下面的代码对我有用,同时将 HDFS 中的 ORC 文件加载到配置单元表中。

  1. 在 hive 中创建一个表。

     create table MyDB.TEST (
     Col1 String,
     Col2 String,
     Col3 String,
     Col4 String)
     STORED AS INPUTFORMAT
           'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat'
     OUTPUTFORMAT
      'org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat';
    
  2. 将数据加载到表中。

     LOAD DATA INPATH '/hdfs/dir/folder/to/orc/files/' INTO TABLE MyDB.TEST;
    
于 2018-02-10T04:11:06.677 回答
0

经过几次尝试,这是适合我的解决方案:

create table MyDB.TEST (
Col1 String,
Col2 String,
Col3 String,
Col4 String)
STORED AS ORC
LOCATION 'hdfs://hdfs/dir/folder/to/orc/files/';
于 2020-12-15T16:38:44.103 回答