根据http://sqoop.apache.org/docs/1.4.0-incubating/SqoopUserGuide.html#id1764646
您可以导入以下两种文件格式之一的数据:分隔文本或 SequenceFiles。
但是 RCFile 呢?
是否可以使用 Sqoop 以 RCFile 格式将数据从 Oracle DB 导入 HDFS?
如果是,该怎么做?
根据http://sqoop.apache.org/docs/1.4.0-incubating/SqoopUserGuide.html#id1764646
您可以导入以下两种文件格式之一的数据:分隔文本或 SequenceFiles。
但是 RCFile 呢?
是否可以使用 Sqoop 以 RCFile 格式将数据从 Oracle DB 导入 HDFS?
如果是,该怎么做?
Sqoop 目前不支持 RC 文件。有一个 jira SQOOP-640可以添加此功能。
Step 1: Create a ORC formatted table (base) in Hive.
CREATE TABLE IF NOT EXISTS tablename (hivecolumns) STORED AS RCFILE
Step 2 : Sqoop import to this RC table using HCatalog tool.
SQOOP IMPORT
--connect sourcedburl
--username XXXX
--password XXXX
--table source_table
--hcatalog-database hivedb
--hcatalog-table tablename
[ HCatalog 的表抽象为用户提供了 Hadoop 分布式文件系统 (HDFS) 中数据的关系视图,并确保用户无需担心他们的数据存储在何处或以何种格式 - RCFile 格式、文本文件、SequenceFiles 或 ORC 文件.]