0

问题:我在外部数据库中有一个表,其中包含我上次从 Kafka Bus 轮询的 kafka 事件。该表包含所有事件的复合主键 PK(主题、分区、偏移量)。

所以我可以很容易地为每个主题和分区确定最新的事件。

现在我很想做这样的选择:

SELECT event 
  FROM topic
 WHERE event.partition = partition0 AND event.offset > partition0.offset
    OR event.partition = partition1 AND event.offset > partition1.offset
...

当然,我希望该语句立即返回队列中当前的所有事件,并将结果写入 HDFS 文件。

我将如何使用 KSQL 做到这一点?

注意:当然,我希望将所有分区及其相应的偏移量成对放入一个数组中,并在 where 子句中使用它......这将是一个优质的解决方案。

4

0 回答 0