如果这是我的 Apache 日志的外观,我应该在 PigLatin 中使用什么分隔符来拆分数据。
[Mon Jul 02 10:04:18 2012] [error] [client x.x.x.x] File does not exist: /home/ec2- user/xxxxxxxxxx/xxxxxxxxx, referer: http://xxxx/xxxxx/xxxxx/
我试过 PigStorage(',') 来拆分引用者和其他字符串。但我怎么能分裂
[Mon Jul 02 10:04:18 2012] [error] [client x.x.x.x] File does not exist: /home/ec2-user/xxxxxxxxxx/xxxxxxxxx
如果我使用空格作为分隔符 Mon Jul 02 10:04:18 2012 将被拆分为多个字符串。