我想在 Hive 中创建表
CREATE TABLE table (
a string
,b string
)
PARTITIONED BY ( pr_filename string )
ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.RegexSerDe'
WITH SERDEPROPERTIES ('input.regex'='reg_exp') ;
但源数据具有以“#”开头的多行标题
# <some comment>
#
# <some other comments>
# <some other comments>
# <some other comments>
#
a,b
1,2
8,2
8,9
是否可以编写reg_exp来过滤掉所有以所选字符开头的行,或者我是否必须使用临时表来处理这个标题?