3

我正在尝试使用 Oracle 11g(开发中的 11.1,生产中的 11.2)进行数值分析,特别是对具有三列感兴趣的表的线性插值:时间戳、设备 ID 和值。

值列保存来自设备的数据(id 为 deviceid),在时间戳中给定的时间获取。例如,这是伪造的数据,但它给出了这样的想法:

     time       |  deviceid  |  value   
----------------|------------|-----------
 01:00:00.000   |  001       | 1.000
 01:00:01.000   |  001       | 1.030
 01:00:02.000   |  001       | 1.063 
 01:00:00.050   |  002       | 553.10
 01:00:01.355   |  002       | 552.30
 01:00:02.155   |  002       | 552.43 

来自设备 001 的时间戳与设备 002 的时间戳不匹配,但我需要将设备 001 和 002 的值放在一行中,并带有一个时间戳,与设备 001 的时间戳匹配。我想要结束的是像这样的东西:

     time       |  device 001  |  device 002   
----------------|--------------|------------
 01:00:00.000   |  1.000       |  null
 01:00:01.000   |  1.030       |  552.520
 01:00:02.000   |  1.063       |  552.405

其中设备 002 的值是基于设备 002 的值在设备 001 的每个时间戳两侧的两个最接近的时间戳处收集的值进行线性插值的。发生空值是因为我在设备 002 的任一侧都没有两个时间戳01:00:00.000,我不想推断这个值。

据我了解,我可以使用 percentile_cont 来做到这一点,但我不明白我在网上看到的例子。例如, percentile_cont 使用的百分位数来自哪里?

在此先感谢您的帮助!

4

3 回答 3

3

我不确定您将如何使用PERCENTILE_CONT您要求的插值,但借助不同的分析函数,您可以实现您想要的。

首先,我们将创建以下函数,将INTERVAL DAY TO SECOND值转换为秒:

CREATE OR REPLACE FUNCTION intvl_to_seconds(
    p_interval INTERVAL DAY TO SECOND
) RETURN NUMBER DETERMINISTIC
AS
BEGIN
  RETURN EXTRACT(DAY FROM p_interval) * 24*60*60
       + EXTRACT(HOUR FROM p_interval) * 60*60
       + EXTRACT(MINUTE FROM p_interval) * 60
       + EXTRACT(SECOND FROM p_interval);
END;
/

使用此函数,我们可以使用如下查询:

SELECT d1.time,
       d1.value AS value1,
       q2.prev_value + intvl_to_seconds(d1.time - q2.prev_time) * (q2.next_value - q2.prev_value)/intvl_to_seconds(q2.next_time - q2.prev_time) AS value2
  FROM devices d1
  LEFT OUTER JOIN (SELECT d2.time AS prev_time,
                          d2.value AS prev_value,
                          LEAD(d2.time, 1) OVER (ORDER BY d2.time) AS next_time,
                          LEAD(d2.value, 1) OVER (ORDER BY d2.time) AS next_value
                     FROM devices d2
                    WHERE d2.deviceid = 2) q2
               ON d1.time BETWEEN q2.prev_time AND q2.next_time
 WHERE d1.deviceid = 1;

我在上面获取了您的数据,将时间戳的日期部分设置为今天,当我运行上面的查询时得到以下结果:

TO_CHAR(D1.TIME) VALUE1 VALUE2
------------------------------------- ---------- --- --------
11 年 9 月 9 日 01.00.00.000000 1
11 年 9 月 9 日 01.00.01.000000 1.03 552.517625
11 年 9 月 9 日 01.00.02.000000 1.063 552.404813

(我添加了一个TO_CHAR环绕d1.time来减少 SQL*Plus 中过多的间距。)

如果您使用DATEs 而不是TIMESTAMPs,则不需要该函数:您只需减去日期即可。

于 2011-09-09T21:43:47.863 回答
0

我正在使用@Luke Woodward 查询的修改版本:

SELECT d1.time,
   d1.value AS value1,
   q2.prev_value + 
   (EXTRACT( SECOND FROM (d1.time - q2.prev_time)) +
    EXTRACT( MINUTE FROM (d1.time - q2.prev_time)) * 60 ) 
    * (q2.next_value - q2.prev_value)/
      (EXTRACT ( SECOND FROM (q2.next_time - q2.prev_time)) + 
      EXTRACT ( MINUTE FROM (q2.next_time - q2.prev_time)) * 60)  AS value2
FROM devices d1
LEFT OUTER JOIN (SELECT d2.time AS prev_time,
                      d2.value AS prev_value,
                      LEAD(d2.time, 1) OVER (ORDER BY d2.time) AS next_time,
                      LEAD(d2.value, 1) OVER (ORDER BY d2.time) AS next_value
                 FROM devices d2
                WHERE d2.deviceid = 2
                      and time between '20100914 000000' and '20100915 000000'
                ) q2
           ON d1.time BETWEEN q2.prev_time AND q2.next_time
 WHERE d1.deviceid = 1;

但插值始终显示为空,即使日期范围内有设备 2 的数据。

请注意,我必须在 q2 中为查询添加日期范围,这可能是普通连接丢失外部数据的原因。

如果我使用普通连接,我不会得到插值数据的空值,但是在使用普通连接时,我会丢失设备 2 端点之外的设备 1 的数据(q2 中的插值设备)。建议?

于 2011-09-16T16:50:44.027 回答
0

日期范围的最终解决方案:

SELECT
    d1.time,
    d1.value AS value1,
    q2.prev_value + 
    (EXTRACT( SECOND FROM (d1.time - q2.prev_time)) +
     EXTRACT( MINUTE FROM (d1.time - q2.prev_time)) * 60 ) 
     * (q2.next_value - q2.prev_value)/
       (EXTRACT ( SECOND FROM (q2.next_time - q2.prev_time)) + 
        EXTRACT ( MINUTE FROM (q2.next_time - q2.prev_time)) * 60
    )  AS value2
FROM devices d1
LEFT OUTER JOIN (
    SELECT d2.time AS prev_time,
           d2.value AS prev_value,
           LEAD(d2.time, 1) OVER (ORDER BY d2.time) AS next_time,
           LEAD(d2.value, 1) OVER (ORDER BY d2.time) AS next_value
    FROM devices d2
    WHERE d2.deviceid = 2
    AND time BETWEEN '20100914 000000' AND '20100915 000000'
) q2
ON d1.time BETWEEN q2.prev_time AND q2.next_time
WHERE d1.deviceid = 1
AND time BETWEEN '20100914 000000' AND '20100915 000000';
于 2011-10-19T18:21:07.197 回答