sql - 满足条件时重新启动 Row_Number 序列

Question

我遇到了一个看起来很简单的路障，但我似乎无法找到解决方案。我希望这里的一些对 Oracle SQL 有更多了解的人可以提供帮助。

本质上，我正在构建一个按完整日期排列的工作列表，这很简单。它们之间的共同联系是它们都针对同一个客户（不同的编号）和相同的位置（不同的编号）。我的问题是，每当两个工作之间的持续时间超过 30 天时，我需要找到一种方法来中断并从 1 重新开始该排名/计数。这是我正在查看的简化版本：

JOBCOUNT  ACCTNUM   LOCNUM      COMPDATE           DURATION  
--------  -------   ------      --------           -------- 
  2        001       003      8/21/2015 16:47     15.48763889        
  3        001       003      10/5/2015 11:31     41.98304398        
  4        001       003      10/19/2015 9:59     13.21804398        
  5        001       003      11/13/2015 15:23    24.43752315         
  6        001       003      11/30/2015 19:19    11.35537037

由于第二行的持续时间超过30，我想怎么看，如下：

JOBCOUNT  ACCTNUM   LOCNUM      COMPDATE           DURATION  
--------  -------   ------      --------           -------- 
  2        001       003      8/21/2015 16:47     15.48763889        
  1        001       003      10/5/2015 11:31     41.98304398        
  2        001       003      10/19/2015 9:59     13.21804398        
  3        001       003      11/13/2015 15:23    24.43752315         
  4        001       003      11/30/2015 19:19    11.35537037

因为第二份工作超出了 30 天的窗口，所以链条应该从下一份工作重新开始。我的问题是我找不到对数据进行分区的方法，以便识别此标准并重新开始计数。没有其他列可以让我以这种方式对 row_number 或 dense_rank 进行分区（例如，每个 30 天链的公共订单键或系统作业序列）。

我已经尝试了大约 20 种不同的方法来解析我在这里读过的线程中的这些数据，但无济于事，所以任何关于如何实现这一点的帮助或想法都将不胜感激。我有大约 50,000 行需要应用此排序的数据。我已经在工作中和工作中自学 SQL 大约一年了。我已经达到了我对这个的知识极限。

score 2 · Accepted Answer

基本上，您需要一个额外的分组。您可以通过对差异大于 30 计算的标志进行累积和来计算分组。然后其余的看起来像row_number()：

select t.*,
       row_number() over (partition by acctnum, locnum, grp order by compdate) as jobcount  
from (select t.*,
             sum(case when duration > 30 then 1 else 0 end) over
                 (partition by acctnum, locnum order by compdate) as grp
      from t
     ) t;

但是，您的示例数据从 2 而不是 1 开始，我不完全理解。

sql - 满足条件时重新启动 Row_Number 序列

1 回答 1

Related

Reference