我有一个文件id
和year
. 我的字段由,
和分隔.
。我有没有机会代替由 can I use ,
and终止的字段.
?
问问题
209 次
1 回答
1
这可以使用 RegexSerDe。
hive> CREATE EXTERNAL TABLE citiesr1 (id int, city_org string, ppl float)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.RegexSerDe'
WITH SERDEPROPERTIES ('input.regex'='^(\\d+)\\.(\\S+),(\\d++.\\d++)\\t.*')
LOCATION '/user/it1/hive/serde/regex';
在上面的正则表达式中定义了三个正则表达式组。
(\\d+) leading digits is the int id column
dot . is a separator
(\\S+) - string without spaces is the city_org string column
comma , is a separator
(\\d++.\\d++) - float column
\\t - tab separator
于 2017-12-22T16:07:53.293 回答