我有一个 .csv 文件,格式为一个(第一)列/单元格,我的配置单元表中有我想要的五个字段,用分号分隔;像这样:
ISBN;"Title";"Author";"Year";"Publisher"
0002005018;"Clara Callan";"Richard Bruce Wright";"2001";"HarperFlamingo Canada"
0399135782;"The Kitchen God's Wife";"Amy Tan";"1991";"Putnam Pub Group"
etc.
etc.
...
我可以使用 Hive 查询来拆分数据吗?并将其存储在我创建的具有相同列名顺序的表中?
像regexp_extract?还是我需要使用serde?
我是 Hadoop/hive/beeswax 的新手,正在使用 Cloudera-quickstart vm 5.2