我有一个文件,其中包含这样的条目:
1,1,07 2012,07 2013,11,blablabla
前两个字段是 id。第三个是开始日期(月年),第四个是结束日期。第五个字段是这两个日期之间的月数。最后一个字段包含文本。
这是我加载这些数据的猪代码:
f = LOAD 'file.txt' USING PigStorage(',') AS (id1:int, id2:int, date1:chararray, date2:chararray, duration:int, text:chararray);
我想过滤我的文件,以便只保留 date2 从今天起不到三年的条目。在 Pig 有可能吗?
谢谢。