我有一个格式的mysqldump:
INSERT INTO `MY_TABLE` VALUES (893024968,'342903068923468','o03gj8ip234qgj9u23q59u','testing123','HTTP','1','4213883b49b74d3eb9bd57b7','blahblash','2011-04-19 00:00:00','448','206',NULL,'GG');
如何使用 pig 加载这些数据?我努力了;
A = LOAD 'pig-test/test.log' USING PigStorage(',') AS (ID: chararray, USER_ID: chararray, TOKEN: chararray, NODE: chararray, CHANNEL: chararray, CODE: float, KEY: chararray, AGENT: chararray, TIME: chararray, DURATION: float, RESPONSE: chararray, MESSAGE: chararray, TARGET: chararray);
使用 , 作为分隔符可以正常工作,但我希望 ID 是一个 int,我无法弄清楚如何切断前导“INSERT INTO MY_TABLE
VALUES(”和尾随“);” 加载时。
另外我应该如何加载日期时间信息以便我可以查询它?
你能提供的任何帮助都会很棒。