我的日志如下所示:
client_id;event_1;event_2;event3
我想得到一个这样的 SQL 表:
client_id | event
---------------------
... | event_1
... | event_2
... | event_3
我是 Hive 的新手,在我看来,一条日志行总是在生成的 SQL 表中提供一个条目。我尝试了以下(不成功):
CREATE EXTERNAL TABLE IF NOT EXISTS tablename (
client_id String,
`event` String
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.RegexSerDe'
WITH SERDEPROPERTIES (
"input.regex" = "^([^\;]+);.*([^\;]+).*$" )
LOCATION 's3://myBucket/prefix/';
它只需要第一个事件而忽略其他事件......