1

根据http://sqoop.apache.org/docs/1.4.0-incubating/SqoopUserGuide.html#id1764646

您可以导入以下两种文件格式之一的数据:分隔文本或 SequenceFiles。

但是 RCFile 呢?

是否可以使用 Sqoop 以 RCFile 格式将数据从 Oracle DB 导入 HDFS?

如果是,该怎么做?

4

2 回答 2

3

Sqoop 目前不支持 RC 文件。有一个 jira SQOOP-640可以添加此功能。

于 2013-02-22T02:12:19.450 回答
0
Step 1: Create a ORC formatted table (base) in Hive.
    CREATE TABLE IF NOT EXISTS  tablename (hivecolumns)   STORED AS RCFILE

 Step 2 : Sqoop import to this RC table using HCatalog tool.  
     SQOOP IMPORT 
    --connect sourcedburl
    --username XXXX
    --password XXXX
     --table source_table
     --hcatalog-database hivedb
    --hcatalog-table tablename 

[ HCatalog 的表抽象为用户提供了 Hadoop 分布式文件系统 (HDFS) 中数据的关系视图,并确保用户无需担心他们的数据存储在何处或以何种格式 - RCFile 格式、文本文件、SequenceFiles 或 ORC 文件.]

于 2016-10-04T13:22:29.320 回答