如何SELECT
使用 Apache fFlink 删除查询中的重复项?
我想删除 ID 中的重复项以保持最大范围
假设查询是在静态数据集上运行的,可以用常规的 SQL 来解决。由于 Flink 实现了标准 SQL,因此该查询不是 Flink 特定的,而是可以在任何关系数据库系统上运行。
SELECT DISTINCT t.id, t.name, t.range
FROM t, (SELECT id, MAX(range) AS maxRange FROM t GROUP BY id) s
WHERE t.id = s.id AND t.range = s.maxRange
请注意,如果有一个 id 的最大范围超过一行,您将丢失重复项。