我是 Hive 的新手,我有一张表,其中的架构是:
Name, Count, Timestamp
我想知道是否可以编写一个查询来触发 EMR 作业并在给定间隔和开始/结束时期的情况下提取/聚合每个名称的计数列表。
例如
表格内容:
NameA, 1, 10000
NameA, 1, 2
NameA, 1, 1
NameB, 1, 500
NameB, 1, 1
参数:
Interval: 1000ms
Start: 0
End: 10000
输出:
NameA, [2,0,0,0,0,0,0,0,0,1]
NameB, [2,0,0,0,0,0,0,0,0,0]