0

我有一个包含三列 ID、Date、Value 的表。我想对行进行排名,以便在 ID 内,排名随着值至少为 X 的每个日期上升,否则排名保持不变。

给定 ID、日期和类似的值

1, 6/1, 8
1, 6/2, 12
1, 6/3, 14
1, 6/4, 9
1, 6/5, 11

我想根据至少 10 的值返回一个排名,这样我就会有这样的 ID、Date、Value 和 Rank:

1, 6/1, 8, 0
1, 6/2, 12, 1
1, 6/3, 14, 2
1, 6/4, 9, 2
1, 6/5, 11, 3

换句话说,每次值超过阈值时,排名都会增加,否则保持不变。

我试过的是

SELECT T1.*, X.Ranking FROM TABLE T1
LEFT JOIN ( SELECT *, DENSE_RANK( ) OVER ( PARTITION BY T2.ID ORDER BY T2.DATE ) Ranking
    FROM TABLE T2 WHERE T2.VALUE >= 10 ) X
ON T1.ID = T2.ID AND T1.Date = T2.Date

这几乎可以工作。它让我输出像

1, 6/1, 8, NULL
1, 6/2, 12, 1
1, 6/3, 14, 2
1, 6/4, 9, NULL
1, 6/5, 11, 3

然后,我想把第一个 NULL 变成 0,第二个变成 2。

我把上面的查询变成了一个 cte 并尝试了

    SELECT T1.*, CASE WHEN T1.Ranking IS NULL THEN ISNULL( (
        SELECT MAX( T2.Ranking ) 
        FROM cte T2 WHERE T1.ID = T2.ID AND T1.Date > T2.Date, 0 ) 
            ELSE T1.Ranking END NewRanking
    FROM cte T1

这看起来可行,但我的表有 200,000 行,查询运行了 25 分钟......所以,我正在寻找比 SELECT MAX 更开箱即用的东西。

4

2 回答 2

2

您使用的是 SQL Server 2012,因此您可以进行累计:

select t.*,
       sum(case when value >= 10 then 1 else 0 end) over
              (partition by id order by date) as ranking
from table t;
于 2013-07-16T23:15:42.337 回答
0

编辑:这实际上不起作用。从本质上讲,它会获取先前的 LAG 值并将其递增,但这不是 LAG 的工作方式……本质上它将是“递归的”,这会导致“my_rank”是未定义的语法错误。更好的解决方案是基于累积和的公认答案。

如果您有 SQL Server 2012(您没有标记您的问题),您可以执行以下操作:

SELECT 
  LAG(my_rank, 1, 0) OVER (ORDER BY DATE) 
  + CASE WHEN VALUE >= 10 THEN 1 ELSE 0 END AS my_rank
FROM T1

于 2013-07-16T22:26:03.837 回答