mysql - 如何从一个 .csv 文件中创建一个 Hive 表，该文件有一列的字段由分号分隔；

Question

我有一个 .csv 文件，格式为一个（第一）列/单元格，我的配置单元表中有我想要的五个字段，用分号分隔；像这样：

ISBN;"Title";"Author";"Year";"Publisher"
0002005018;"Clara Callan";"Richard Bruce Wright";"2001";"HarperFlamingo Canada"
0399135782;"The Kitchen God's Wife";"Amy Tan";"1991";"Putnam Pub Group"

etc. 
etc.
...

我可以使用 Hive 查询来拆分数据吗？并将其存储在我创建的具有相同列名顺序的表中？

像regexp_extract？还是我需要使用serde？

我是 Hadoop/hive/beeswax 的新手，正在使用 Cloudera-quickstart vm 5.2

score 2 · Accepted Answer

听起来你想做这样的事情：

CREATE TABLE books (ISBN STRING, Title STRING, Author STRING, Year STRING, Publisher STRING)
  ROW FORMAT DELIMITED FIELDS TERMINATED BY "\;";
LOAD DATA INPATH '/path/to/your/datafile' INTO TABLE books;

mysql - 如何从一个 .csv 文件中创建一个 Hive 表，该文件有一列的字段由分号分隔；

1 回答 1

Related

Reference