3

我遇到了一个看起来很简单的路障,但我似乎无法找到解决方案。我希望这里的一些对 Oracle SQL 有更多了解的人可以提供帮助。

本质上,我正在构建一个按完整日期排列的工作列表,这很简单。它们之间的共同联系是它们都针对同一个客户(不同的编号)和相同的位置(不同的编号)。我的问题是,每当两个工作之间的持续时间超过 30 天时,我需要找到一种方法来中断并从 1 重新开始该排名/计数。这是我正在查看的简化版本:

JOBCOUNT  ACCTNUM   LOCNUM      COMPDATE           DURATION  
--------  -------   ------      --------           -------- 
  2        001       003      8/21/2015 16:47     15.48763889        
  3        001       003      10/5/2015 11:31     41.98304398        
  4        001       003      10/19/2015 9:59     13.21804398        
  5        001       003      11/13/2015 15:23    24.43752315         
  6        001       003      11/30/2015 19:19    11.35537037        

由于第二行的持续时间超过30,我想怎么看,如下:

JOBCOUNT  ACCTNUM   LOCNUM      COMPDATE           DURATION  
--------  -------   ------      --------           -------- 
  2        001       003      8/21/2015 16:47     15.48763889        
  1        001       003      10/5/2015 11:31     41.98304398        
  2        001       003      10/19/2015 9:59     13.21804398        
  3        001       003      11/13/2015 15:23    24.43752315         
  4        001       003      11/30/2015 19:19    11.35537037 

因为第二份工作超出了 30 天的窗口,所以链条应该从下一份工作重新开始。我的问题是我找不到对数据进行分区的方法,以便识别此标准并重新开始计数。没有其他列可以让我以这种方式对 row_number 或 dense_rank 进行分区(例如,每个 30 天链的公共订单键或系统作业序列)。

我已经尝试了大约 20 种不同的方法来解析我在这里读过的线程中的这些数据,但无济于事,所以任何关于如何实现这一点的帮助或想法都将不胜感激。我有大约 50,000 行需要应用此排序的数据。我已经在工作中和工作中自学 SQL 大约一年了。我已经达到了我对这个的知识极限。

4

1 回答 1

2

基本上,您需要一个额外的分组。您可以通过对差异大于 30 计算的标志进行累积和来计算分组。然后其余的看起来像row_number()

select t.*,
       row_number() over (partition by acctnum, locnum, grp order by compdate) as jobcount  
from (select t.*,
             sum(case when duration > 30 then 1 else 0 end) over
                 (partition by acctnum, locnum order by compdate) as grp
      from t
     ) t;

但是,您的示例数据从 2 而不是 1 开始,我不完全理解。

于 2016-02-03T22:37:43.130 回答