问题:我在外部数据库中有一个表,其中包含我上次从 Kafka Bus 轮询的 kafka 事件。该表包含所有事件的复合主键 PK(主题、分区、偏移量)。
所以我可以很容易地为每个主题和分区确定最新的事件。
现在我很想做这样的选择:
SELECT event
FROM topic
WHERE event.partition = partition0 AND event.offset > partition0.offset
OR event.partition = partition1 AND event.offset > partition1.offset
...
当然,我希望该语句立即返回队列中当前的所有事件,并将结果写入 HDFS 文件。
我将如何使用 KSQL 做到这一点?
注意:当然,我希望将所有分区及其相应的偏移量成对放入一个数组中,并在 where 子句中使用它......这将是一个优质的解决方案。