0

我在class_period表中有超过 10,000 条记录。当我运行如下所示的查询时,获取数据需要花费太多时间。

你能帮我吗 - 我怎样才能加快查询速度?

 WITH DATA AS
     ( SELECT distinct class_time , class_id   
       from class_period       
       
      )
   SELECT distinct class_id, trim(regexp_substr(class_time, '[^:]+', 1, LEVEL)) class_time
    FROM DATA
    CONNECT BY regexp_substr(class_time , '[^:]+', 1, LEVEL) IS NOT NULL

作为图像附加的示例数据 在此处输入图像描述

所需数据作为图像附加 在此处输入图像描述

我正在使用 oracle 11g。

4

2 回答 2

1
  1. 修复您的查询,这样您就不需要使用DISTINCT. 您的方法的问题是您正在使用具有多行输入的分层查询,并且无法将层次结构的每个级别与上一级相关联,因此查询会将其与上一级的所有项目相关联层次结构和您将在每个深度生成越来越多的重复行。这是非常低效的。
  2. 从使用正则表达式更改为简单的字符串函数。

相反,您可以使用:

WITH bounds ( class_id, class_time, start_pos, end_pos ) AS (
  SELECT class_id,
         class_time,
         1,
         INSTR( class_time, ':', 1 )
  FROM   data
UNION ALL
  SELECT class_id,
         class_time,
         end_pos + 1,
         INSTR( class_time, ':', end_pos + 1 )
  FROM   bounds
  WHERE  end_pos > 0
)
SELECT class_id,
       CASE end_pos
       WHEN 0
       THEN SUBSTR( class_time, start_pos )
       ELSE SUBSTR( class_time, start_pos, end_pos - start_pos )
       END AS class_time
FROM   bounds;

其中,对于样本数据:

CREATE TABLE data ( class_id, class_time ) AS
SELECT 1, '0800AM:0830AM' FROM DUAL UNION ALL
SELECT 1, '0900AM' FROM DUAL UNION ALL
SELECT 2, '0830AM:0900AM:0930AM' FROM DUAL UNION ALL
SELECT 2, '1000AM' FROM DUAL;

输出:

CLASS_ID | 上课时间
--------: | :---------
       1 | 0800AM    
       1 | 0900AM    
       2 | 0830AM    
       2 | 上午 1000 点    
       1 | 0830AM    
       2 | 0900AM    
       2 | 0930AM    

db<>在这里摆弄

但是,更好的方法是更改​​存储数据的模型并停止将其存储为分隔字符串,而是将其存储在单独的表中,或者可能作为嵌套表中的集合。

使用第二个表的示例是:

CREATE TABLE data (
  class_id   NUMBER PRIMARY KEY
);

CREATE TABLE class_times (
  class_id   NUMBER REFERENCES data ( class_id ),
  class_time VARCHAR2(6)
);

INSERT ALL
  INTO data ( class_id ) VALUES ( 1 )
  INTO data ( class_id ) VALUES ( 2 )
  INTO class_times ( class_id, class_time ) VALUES ( 1, '0800AM' )
  INTO class_times ( class_id, class_time ) VALUES ( 1, '0830AM' )
  INTO class_times ( class_id, class_time ) VALUES ( 1, '0900AM' )
  INTO class_times ( class_id, class_time ) VALUES ( 2, '0830AM' )
  INTO class_times ( class_id, class_time ) VALUES ( 2, '0900AM' )
  INTO class_times ( class_id, class_time ) VALUES ( 2, '0930AM' )
  INTO class_times ( class_id, class_time ) VALUES ( 2, '1000AM' )
SELECT * FROM DUAL;

那么您的查询将是(假设您需要data旁边的其他列class_id):

SELECT d.class_id,
       c.class_time
FROM   data d
       INNER JOIN class_times c
       ON ( d.class_id = c.class_id );

哪个输出:

CLASS_ID | 上课时间
--------: | :---------
       1 | 0800AM    
       1 | 0830AM    
       1 | 0900AM    
       2 | 0830AM    
       2 | 0900AM    
       2 | 0930AM    
       2 | 上午 1000 点    

使用嵌套表的示例是:

CREATE TYPE stringlist IS TABLE OF VARCHAR2(6);

CREATE TABLE data (
  class_id   NUMBER,
  class_time stringlist
) NESTED TABLE class_time STORE AS data__class_time;

INSERT INTO data ( class_id, class_time )
SELECT 1, stringlist( '0800AM','0830AM' ) FROM DUAL UNION ALL
SELECT 1, stringlist( '0900AM' ) FROM DUAL UNION ALL
SELECT 2, stringlist( '0830AM','0900AM','0930AM' ) FROM DUAL UNION ALL
SELECT 2, stringlist( '1000AM' ) FROM DUAL;

那么您的查询将变为:

SELECT d.class_id,
       ct.COLUMN_VALUE AS class_time
FROM   data d
       CROSS APPLY TABLE ( d.class_time ) ct

哪个输出:

CLASS_ID | 上课时间
--------: | :---------
       1 | 0800AM    
       1 | 0830AM    
       1 | 0900AM    
       2 | 0830AM    
       2 | 0900AM    
       2 | 0930AM    
       2 | 上午 1000 点    

db<>在这里摆弄

于 2020-10-25T21:18:21.870 回答
0

MT0 发现了connect by过滤器允许读取所有行的大问题。您不需要将其转换为递归 CTE,因为您已经区分了您正在投影的所有列,可以将其视为您的主键(假设它不可为空或您不想要空值) .

你还需要一个特殊的过滤器,这样它就不会误以为你有一个无限循环。

 WITH DATA AS
     ( SELECT distinct class_time , class_id   
       from class_period       
      )
   SELECT distinct class_id, trim(regexp_substr(class_time, '[^:]+', 1, LEVEL)) class_time
    FROM DATA
    CONNECT BY regexp_substr(class_time , '[^:]+', 1, LEVEL) IS NOT NULL
and prior class_time = class_time
and prior class_id = class_id
and prior sys_guid() is not null

prior sys_guid() is not null防止它与ORA-01436: CONNECT BY loop in user data.

这应该类似于递归 CTE。

于 2020-10-25T21:46:10.603 回答