1

在 hue-hive 界面中使用文件创建表时,我们必须指定分隔符。(制表符、空格、逗号等)。但是我的文件由一个或多个空格分隔。如何指定分隔符以一个或多个空格分隔。

在此处输入图像描述

4

1 回答 1

0

您可以通过这种方式创建使用正则表达式作为分隔符的表:

数据,把数据放到hdfs

1  2 3   4
a   b  c d

创建表:

//grammar for create table
CREATE TABLE test1(
a string, 
b string, 
c string, 
d string
)
ROW FORMAT  SERDE 'org.apache.hadoop.hive.contrib.serde2.RegexSerDe'  WITH SERDEPROPERTIES  
(
"input.regex" ="([^\\s]*)\\s+([^\\s]*)\\s+([^\\s]*)\\s+([^\\s]*)",
"output.format.string" = "%1$s %2$s %3$s %4$s"
)  
LOCATION '/test1/';
于 2015-12-30T05:32:14.070 回答