从 Sean G 解决方案中,我删除了完整表格上的 Group By。事实上,为 Oracle SQL 重新调整了几个部分。
首先在找到上一次之后,分配自己的父母ID。如果在 Previous Time 中有 null,那么我们排除给它一个 ID。
现在基于通过避免空值来获取最近的自身父 ID,以便所有最近的 30 秒 cusip 都属于一个组。
由于有一个 CUSIP 列,我假设数据集将是大型市场交易数据。而不是在完整表上使用 group by,而是使用 CUSIP 分区和最终 Group Parent ID 以获得更好的性能。
SELECT
id,
sub.parent_id,
sub.cusip,
timestamp,
quantity,
sum(sub.quantity) OVER(
PARTITION BY cusip, parent_id
) sum_quantity,
MIN(sub.timestamp) OVER(
PARTITION BY cusip, parent_id
) min_timestamp
FROM
(
SELECT
base_sub.*,
CASE
WHEN base_sub.self_parent_id IS NOT NULL THEN
base_sub.self_parent_id
ELSE
LAG(base_sub.self_parent_id) IGNORE NULLS OVER(
PARTITION BY cusip
ORDER BY
timestamp, id
)
END parent_id
FROM
(
SELECT
c.*,
CASE
WHEN nvl(abs(EXTRACT(SECOND FROM to_timestamp(previous_timestamp, 'yyyy/mm/dd hh24:mi:ss') - to_timestamp
(timestamp, 'yyyy/mm/dd hh24:mi:ss'))), 31) > 30 THEN
id
ELSE
NULL
END self_parent_id
FROM
(
SELECT
my_table.id,
my_table.cusip,
my_table.timestamp,
my_table.quantity,
LAG(my_table.timestamp) OVER(
PARTITION BY my_table.cusip
ORDER BY
my_table.timestamp, my_table.id
) previous_timestamp
FROM
my_table
) c
) base_sub
) sub
下面是表格行
输入数据:
下面是输出
结果