sql - Apache Flink：如何在选择查询中删除重复项？

Question

如何SELECT使用 Apache fFlink 删除查询中的重复项？

我的桌子是：

我想删除 ID 中的重复项以保持最大范围

score 1 · Accepted Answer

假设查询是在静态数据集上运行的，可以用常规的 SQL 来解决。由于 Flink 实现了标准 SQL，因此该查询不是 Flink 特定的，而是可以在任何关系数据库系统上运行。

SELECT DISTINCT t.id, t.name, t.range 
  FROM t, (SELECT id, MAX(range) AS maxRange FROM t GROUP BY id) s
  WHERE t.id = s.id AND t.range = s.maxRange

请注意，如果有一个 id 的最大范围超过一行，您将丢失重复项。

sql - Apache Flink：如何在选择查询中删除重复项？

1 回答 1

Related

Reference