2

如何SELECT使用 Apache fFlink 删除查询中的重复项?

我的桌子是: 在此处输入图像描述

我想删除 ID 中的重复项以保持最大范围

4

1 回答 1

1

假设查询是在静态数据集上运行的,可以用常规的 SQL 来解决。由于 Flink 实现了标准 SQL,因此该查询不是 Flink 特定的,而是可以在任何关系数据库系统上运行。

SELECT DISTINCT t.id, t.name, t.range 
  FROM t, (SELECT id, MAX(range) AS maxRange FROM t GROUP BY id) s
  WHERE t.id = s.id AND t.range = s.maxRange

请注意,如果有一个 id 的最大范围超过一行,您将丢失重复项。

于 2018-03-01T12:33:48.667 回答