问题标签 [apache-pig-grunt]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
hadoop - 使用 Pig latin 从文件中获取最大日期
我有一个包含日期和其他列的文本文件。日期列值的格式为“yyyy-MM-dd HH:mm:ss”。
从文本文件中,我想获取最大日期或最新日期。(注意:我看到 MAX 函数仅在 Pig Latin 中的 GROUP BY 时才有效)
任何人都可以建议是否有办法使用 Pig Latin 或任何替代方法来获得它?
apache-pig - 如果存在多个值,则Apache Pig Group by和Filter?
我正在尝试对具有相同 ID 的多行进行分组,然后检查组中的每个元组是否包含两个值,例如:
在我通过以下方式分组后:groupedData = group dataPoints by data_id;
我得到:
我想过滤并获取10435
if 它包含17
and的值11
。
apache-pig - APACHE PIG - 模式中不存在错误投影字段 [Units_Sold]:组:chararray,D2:bag{:tuple(Item_Type:chararray,Units_Sold:int)}
下午好 - 我有一个销售数据集,我正在尝试查看哪个商品的销量最多。这是我的代码: