19

我正在处理一个 SSRS / SQL 项目并尝试编写一个查询来获取日期之间的差距,我完全不知道如何编写这个。基本上我们有许多可以安排使用的设备,我需要一份报告不使用时显示。

我有一个包含设备 ID、EventStart 和 EventEnd 时间的表,我需要运行查询以获取每个设备的这些事件之间的时间,但我不确定如何执行此操作。

例如:

Device 1 Event A runs from `01/01/2012 08:00 - 01/01/2012 10:00`
Device 1 Event B runs from `01/01/2012 18:00 - 01/01/2012 20:00`    
Device 1 Event C runs from `02/01/2012 18:00 - 02/01/2012 20:00`    
Device 2 Event A runs from `01/01/2012 08:00 - 01/01/2012 10:00`
Device 2 Event B runs from `01/01/2012 18:00 - 01/01/2012 20:00`

我的查询结果应该是

`Device 1 01/01/2012 10:00 - 01/01/2012 18:00`
`Device 1 01/01/2012 20:00 - 02/01/2012 18:00`
`Device 2 01/01/2012 10:00 - 01/01/2012 18:00`

此表中平均大约有 4 - 5 个设备,可能有 200 - 300 + 个事件。

更新:

好的,我会更新它以尝试提供更多信息,因为我似乎没有很好地解释这一点(对不起!)

我正在处理的是一个包含事件详细信息的表,每个事件都是飞行模拟器的预订,我们有许多飞行模拟(称为表中的设备),我们正在尝试生成一个 SSRS 报告,其中我们可以给客户显示每个 SIM 卡可用的天数/时间。

所以我将传入一个开始/结束日期参数并选择这些日期之间的所有可用性。结果应显示为:

Device   Available_From       Available_To
 1       01/01/2012 10:00    01/01/2012 18:00`
 1       01/01/2012 20:00    02/01/2012 18:00`
 2       01/01/2012 10:00    01/01/2012 18:00`

此外,事件有时可能会重叠,尽管这种情况非常罕见,并且由于数据错误,一个设备上的事件与不同设备上的事件重叠并不重要,因为我需要分别了解每个设备的可用性。

4

5 回答 5

25

查询:

假设包含区间的字段名为Startand Finish,表名为YOUR_TABLE,则查询...

SELECT Finish, Start
FROM
    (
        SELECT DISTINCT Start, ROW_NUMBER() OVER (ORDER BY Start) RN
        FROM YOUR_TABLE T1
        WHERE
            NOT EXISTS (
                SELECT *
                FROM YOUR_TABLE T2
                WHERE T1.Start > T2.Start AND T1.Start < T2.Finish
            )
        ) T1
    JOIN (
        SELECT DISTINCT Finish, ROW_NUMBER() OVER (ORDER BY Finish) RN
        FROM YOUR_TABLE T1
        WHERE
            NOT EXISTS (
                SELECT *
                FROM YOUR_TABLE T2
                WHERE T1.Finish > T2.Start AND T1.Finish < T2.Finish
            )
    ) T2
    ON T1.RN - 1 = T2.RN
WHERE
    Finish < Start

...在您的测试数据上给出以下结果:

Finish                      Start
2012-01-01 10:00:00.000     2012-01-01 18:00:00.000

此查询的重要属性是它也可以在重叠间隔上工作。


算法:

1. 合并重叠区间

子查询T1只接受那些在其他区间之外的区间开始。子查询T2对间隔结束执行相同的操作。这就是消除重叠的原因。

DISTINCT如果有两个相同的间隔开始(或结束)在其他间隔之外,这很重要。简单地消除了WHERE Finish < Start任何空间隔(即持续时间 0)。

我们还附加了一个与时间顺序相关的行号,这将在下一步中使用。

T1产量:

Start                       RN
2012-01-01 08:00:00.000     1
2012-01-01 18:00:00.000     2

T2产量:

Finish                      RN
2012-01-01 10:00:00.000     1
2012-01-01 20:00:00.000     2

2. 重构结果

我们现在可以重建“活动”或“非活动”区间。

活动区间是通过将前一个区间的结尾与下一个区间的开头放在一起来重构的,因此- 1在该ON子句中。实际上,我们把...

Finish                      RN
2012-01-01 10:00:00.000     1

...和...

Start                       RN
2012-01-01 18:00:00.000     2

...一起,导致:

Finish                      Start
2012-01-01 10:00:00.000     2012-01-01 18:00:00.000

(可以通过使用和恢复将行从T1旁边放置行来重建活动间隔。)T2JOIN ... ON T1.RN = T2.RNWHERE


这个例子:

这是一个稍微现实一点的例子。以下测试数据:

Device      Event      Start                      Finish
Device 1    Event A    2012-01-01 08:00:00.000    2012-01-01 10:00:00.000
Device 2    Event B    2012-01-01 18:00:00.000    2012-01-01 20:00:00.000
Device 3    Event C    2012-01-02 11:00:00.000    2012-01-02 15:00:00.000
Device 4    Event D    2012-01-02 10:00:00.000    2012-01-02 12:00:00.000
Device 5    Event E    2012-01-02 10:00:00.000    2012-01-02 15:00:00.000
Device 6    Event F    2012-01-03 09:00:00.000    2012-01-03 10:00:00.000

给出以下结果:

Finish                      Start
2012-01-01 10:00:00.000     2012-01-01 18:00:00.000
2012-01-01 20:00:00.000     2012-01-02 10:00:00.000
2012-01-02 15:00:00.000     2012-01-03 09:00:00.000
于 2012-03-07T18:02:06.197 回答
5

第一个答案 - 但请参阅下面的最后一个答案,其中包含 OP 添加的附加约束。

-- 如果你想在最近的 endTime 之后获得下一个 startTime 并避免重叠,你想要类似的东西:

select
    distinct
    e1.deviceId,
    e1.EventEnd,
    e3.EventStart
from Events e1 
join Events e3 on e1.eventEnd < e3.eventStart     /* Finds the next start Time */
and e3.eventStart = (select min(eventStart) from Events e5
                     where e5.eventStart > e1.eventEnd)
and not exists (select *                          /* Eliminates an e1 rows if it is overlapped */
                from Events e5 
                where e5.eventStart < e1.eventEnd
                    and e5.eventEnd > e1.eventEnd)

对于您的三行的情况:

INSERT INTO Events VALUES (1, '01/01/2012 08:00', '01/01/2012 10:00')
INSERT INTO Events VALUES (2, '01/01/2012 18:00', '01/01/2012 20:00')
insert into Events values (2, '01/01/2012 09:00', '01/01/2012 11:00')

这给出了 1 个结果:

January, 01 2012 11:00:00-0800  January, 01 2012 18:00:00-0800

但是,我假设您可能也想在 DeviceId 上进行匹配。在这种情况下,在连接上,您将添加e1.DeviceId = e3.DeviceIde1.deviceId = e5.deviceId

SQL小提琴在这里: http ://sqlfiddle.com/#!3/3899c/8

--

好的,最后的编辑。这是一个查询,添加了 deviceIds 并添加了 distinct 以说明同时结束的事件:

SELECT distinct
    e1.DeviceID,
    e1.EventEnd as LastEndTime,
    e3.EventStart as NextStartTime
FROM Events e1 
join Events e3 on e1.eventEnd < e3.eventStart
     and e3.deviceId = e1.deviceId
     and e3.eventStart = (select min(eventStart) from Events e5
                     where e5.eventStart > e1.eventEnd
                    and e5.deviceId = e3.deviceId)
where not exists (select * from Events e7 
                    where e7.eventStart < e1.eventEnd
                      and e7.eventEnd > e1.eventEnd
                      and e7.deviceId = e1.deviceId)
order by e1.deviceId, e1.eventEnd

与 e3 的连接找到了下一个开始。加入 e5 保证这是当前结束时间之后的最早开始时间。如果考虑的行的结束时间与不同的行重叠,则与 e7 的连接会消除一行。

对于此数据:

INSERT INTO Events VALUES (1, '01/01/2012 08:00', '01/01/2012 10:00')
INSERT INTO Events VALUES (2, '01/01/2012 18:00', '01/01/2012 20:00')
insert into Events values (2, '01/01/2012 09:00', '01/01/2012 11:00')
insert into Events values (2, '01/02/2012 11:00', '01/02/2012 15:00')
insert into Events values (1, '01/02/2012 10:00', '01/02/2012 12:00')
insert into Events values (2, '01/02/2012 10:00', '01/02/2012 15:00')
insert into Events values (2, '01/03/2012 09:00', '01/03/2012 10:00')

你得到这个结果:

1   January, 01 2012 10:00:00-0800  January, 02 2012 10:00:00-0800
2   January, 01 2012 11:00:00-0800  January, 01 2012 18:00:00-0800
2   January, 01 2012 20:00:00-0800  January, 02 2012 10:00:00-0800
2   January, 02 2012 15:00:00-0800  January, 03 2012 09:00:00-0800

SQL 小提琴在这里: http ://sqlfiddle.com/#!3/db0fa/3

于 2012-03-07T16:41:54.673 回答
3

I'm going to assume that it's not really this simple... but here's a query based on my current understanding of your scenario:

DECLARE @Events TABLE (
    DeviceID INT,
    EventStart DATETIME,
    EventEnd DATETIME
)

INSERT INTO @Events VALUES (1, '01/01/2012 08:00', '01/01/2012 10:00')
INSERT INTO @Events VALUES (2, '01/01/2012 18:00', '01/01/2012 20:00')

SELECT
    e1.DeviceID,
    e1.EventEnd,
    e2.EventStart
FROM 
    @Events e1 
    JOIN @Events e2 
        ON e2.EventStart = (
            SELECT MIN(EventStart)
            FROM @Events
            WHERE EventStart > e1.EventEnd
        )
于 2012-03-07T15:49:19.917 回答
2

这是否解决了您的问题:

第二个似乎更相关

'有一个表,其中两列是 DateFrom 和 DateTo。两列都包含日期和时间值。如何找到缺失的日期范围,或者换句话说,表格中任何条目未涵盖的所有日期范围?

于 2012-03-07T15:42:29.447 回答
2

这是我刚刚做的一个 Postgres 解决方案,它不涉及存储过程:

SELECT minute, sum(case when dp.id is null then 0 else 1 end) as s 
FROM generate_series( 
   '2017-12-28'::timestamp,
   '2017-12-30'::timestamp,
   '1 minute'::interval
) minute 
left outer join device_periods as dp
on minute >= dp.start_date and minute < dp.end_date 
group by minute order by minute

generate_series 函数生成一个表,该表在日期范围内的每一分钟都有一行。您可以将时间间隔更改为 1 秒,更准确地说。它是 postgres 特有的功能,但其他引擎中可能存在类似的东西。

此查询将为您提供所有已填写的分钟数,以及所有空白的分钟数。您可以将此查询包装在外部查询中,该查询可以按小时、天分组或执行一些窗口函数操作以获得您需要的准确输出。为了我的目的,我只需要计算是否有空格。

于 2018-01-04T11:19:08.150 回答