在 hue-hive 界面中使用文件创建表时,我们必须指定分隔符。(制表符、空格、逗号等)。但是我的文件由一个或多个空格分隔。如何指定分隔符以一个或多个空格分隔。
问问题
460 次
1 回答
0
您可以通过这种方式创建使用正则表达式作为分隔符的表:
数据,把数据放到hdfs
1 2 3 4
a b c d
创建表:
//grammar for create table
CREATE TABLE test1(
a string,
b string,
c string,
d string
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.RegexSerDe' WITH SERDEPROPERTIES
(
"input.regex" ="([^\\s]*)\\s+([^\\s]*)\\s+([^\\s]*)\\s+([^\\s]*)",
"output.format.string" = "%1$s %2$s %3$s %4$s"
)
LOCATION '/test1/';
于 2015-12-30T05:32:14.070 回答