我想要实现的目标,例如,给定数据:
time, part, data
0, a, 3
1, a, 4
2, b, 10
3, b, 20
3, a, 5
和转型:
stream.keyBy(_.part).scan(0)((s, d) => s + d)
得到:
0, a, 3
1, a, 7
2, b, 10
3, b, 30
3, a, 12
我已经尝试使用 对它进行分区groupAdjacentBy
,但它变得太复杂了,因为我需要使用 Key 保留每个 Chunk 之间的复杂状态。我想知道是否有类似 Flink DataStream 的东西。关键?或者更简单的实现方式?