我只想根据MAX(ts)
. ts = timestamp
. 如果我只选择两列 - deviceid 和 ts,一切都很好:
SELECT deviceid, MAX(ts)
FROM device_data
GROUP BY deviceid
结果:
但我还需要两列 - 经度和纬度。如果我选择经度和纬度,我会遇到问题,因为它们必须出现在 GROUP BY 中,并且使用相同的 deviceid 得到太多结果:
如何避免在 GROUP BY 中插入经度和纬度?
我只想根据MAX(ts)
. ts = timestamp
. 如果我只选择两列 - deviceid 和 ts,一切都很好:
SELECT deviceid, MAX(ts)
FROM device_data
GROUP BY deviceid
结果:
但我还需要两列 - 经度和纬度。如果我选择经度和纬度,我会遇到问题,因为它们必须出现在 GROUP BY 中,并且使用相同的 deviceid 得到太多结果:
如何避免在 GROUP BY 中插入经度和纬度?
您可以创建一个包含perdevice_id
和 max 的表,然后与 original 进行内部联接以获得所需的结果。ts
device_id
device_data
除非您有多行具有相同的device_id
and max(ts)
,否则这应该有效。
SELECT a.deviceid, a.ts, a.longitude, a.lattitude
FROM device_data a
INNER JOIN
(SELECT deviceid, MAX(ts) as max_ts
FROM device_data
GROUP BY deviceid) b ON a.ts = b.max_ts
GROUP BY 1,2,3,4;
有几种解决方案。一种是使用窗口函数在按降序日期排序时获取相同设备ID 的分区内的第一个经度、纬度等。
然后您将获得重复项,您可以使用以下命令将其删除distinct
:
SELECT DISTINCT deviceid,
FIRST_VALUE(longitude) OVER win AS longitude,
FIRST_VALUE(latitude) OVER win AS latitute,
FIRST_VALUE(ts) OVER win AS ts
FROM device_data
WINDOW win AS (PARTITION BY deviceid ORDER BY ts DESC);