问题标签 [apache-pig-grunt]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
248 浏览

hadoop - 使用 Pig latin 从文件中获取最大日期

我有一个包含日期和其他列的文本文件。日期列值的格式为“yyyy-MM-dd HH:mm:ss”。

从文本文件中,我想获取最大日期或最新日期。(注意:我看到 MAX 函数仅在 Pig Latin 中的 GROUP BY 时才有效)

任何人都可以建议是否有办法使用 Pig Latin 或任何替代方法来获得它?

0 投票
1 回答
69 浏览

apache-pig - 如果存在多个值,则Apache Pig Group by和Filter?

我正在尝试对具有相同 ID 的多行进行分组,然后检查组中的每个元组是否包含两个值,例如:

在我通过以下方式分组后:groupedData = group dataPoints by data_id;

我得到:

我想过滤并获取10435if 它包含17and的值11

0 投票
1 回答
21 浏览

apache-pig - APACHE PIG - 模式中不存在错误投影字段 [Units_Sold]:组:chararray,D2:bag{:tuple(Item_Type:chararray,Units_Sold:int)}

下午好 - 我有一个销售数据集,我正在尝试查看哪个商品的销量最多。这是我的代码: