1

我有一个包含日期和其他列的文本文件。日期列值的格式为“yyyy-MM-dd HH:mm:ss”。

从文本文件中,我想获取最大日期或最新日期。(注意:我看到 MAX 函数仅在 Pig Latin 中的 GROUP BY 时才有效)

任何人都可以建议是否有办法使用 Pig Latin 或任何替代方法来获得它?

4

1 回答 1

1

基于样本数据集,

Apple|$600|2009-01-14 00:00:00| 
Apple|$650|2010-12-16 10:20:20| 
Banana|$800|2019-12-14 00:00:00| 
Banana|$800|2016-11-11 01:45:03|

可以使用日期列中的最大值检索

fruits = LOAD 'fruits.txt' using PigStorage('|');
dt = FOREACH fruits GENERATE ToDate($2, 'yyyy-MM-dd HH:mm:ss');
odt = ORDER dt by $0 DESC;
max = LIMIT odt 1;
dump max;
于 2020-03-19T03:55:53.453 回答