我有一个用例,我们需要在窗口内的数据中查找模式。我们正在试验结构化流。我们有一个连续的事件流,并且正在寻找诸如事件 A(设备断开连接)在 10 秒内跟随事件 B(设备重新连接)的模式。或事件 A(断开连接)在 10 秒内没有跟随事件 B(重新连接)。
我正在考虑使用窗口函数将数据集分组为 10 秒的窗口桶,并在每次更新窗口值时检查模式。看起来窗口函数真的被用作结构化流中的 groupBy ,这迫使我使用聚合函数来获取列值的高级聚合。
我想知道在结构化流中使用窗口函数时是否有一种方法可以遍历列的所有值。