2

全部

  1. sql where 子句中的列顺序有什么有效的问题吗?我搜索了网络,然后发现了一些建议,首先说的是加入,然后是其他过滤器。例如,

    select t1.a, t2.b 
    from table1 t1, table2 t2 
    where t1.a = t2.a and t1 > 1 and t2 > 2;
    

如果我换t1 > 1到前面有什么问题t1.a = t2.a吗?

  1. 我想知道存在子句中的列顺序。例如,

    select t1.a, t2.b 
    from table1, table2 t2 
    where t1.a = t2.a 
      and not exists (select 1 from table3 t3 where t1.a = t3.a and t1.b = t3.b)
    

如果我更改为 有任何影响,我会受伤t1.b = t3.bt3.b = t1.b?列顺序很关键吗?

  1. 任何人都可以解释 sql select 执行步骤,并提供一些有用的教程链接吗?
4

4 回答 4

2

大多数时候人们说 WHERE 子句中谓词的顺序不会影响性能是正确的。然而,我们经常对系统中的数据了解更多,尤其是它的分布和偏斜,而不是优化器从其统计数据中得出的结论。在这种情况下,向优化器提供我们所能提供的最佳信息对我们来说很重要。

这是一个从我上周遇到的真实情况中抽象出来的示例(我现在没有时间运行测试用例,但我稍后会)。

情况:三张桌子,一个父母和两个孩子。任务是通过在其子项中查找非唯一行来选择父项中的唯一行。所有表都有数百万行。

我的第一次尝试是这样的:

select parent.*
from   child1
       , child2
       , parent
where child1.col_a = 'whatever'
and child2.col_n = 9999
and child1.parent_id = child2.parent_id
and parent.id = child2.parent_id

该查询返回了正确的结果集,但性能很差。解释计划显示查询正在离开 CHILD2。这是错误的,因为 CHILD1 上的过滤器更具选择性。所以我重新编写了这样的查询:

select parent.*
from   child1
       , child2
       , parent
where child1.col_a = 'whatever'
and child2.col_n = 9999
and child2.parent_id = child1.parent_id
and parent.id = child1.parent_id

现在查询驱动了 CHILD1,性能提高了一个数量级以上。这不会一直发生,但我说摆弄 WHERE 子句仍然是一种有效的调优技术。

CBO 是一款非常智能的软件。尽管如此,我们不能只是向它扔一个杂乱无章的 WHERE 子句,并期望它每次都能产生最好的解释计划。查询越复杂(复杂性由连接数定义),我们以有意义的方式组织 WHERE 子句就越重要。它不会造成任何伤害,它可能只会带来一些好处。


顺便说一句,那些说 ANSI 连接语法不会再次影响性能的人在大多数情况下都是正确的。有时它确实会导致优化器产生较差的执行计划。 了解更多

于 2013-01-23T09:23:10.867 回答
2

要摆脱这种情况,请使用显式 ANSI SQL-92 语法,并使用JOIN关键字:

select t1.a, t2.b 
from table1 t1
inner join table2 t2 on t1.a = t2.a
where  t1 > 1 and t2 > 2;

这样,您将不再有WHERE子句中的连接条件,您可以轻松添加更多条件。

对于您的第二个查询,您可以使用OUTER JOIN

select t1.a, t2.b 
from table1
inner join table2 t2 on t1.a = t2.a
LEFT JOIN table3 t3 on t1.a = t3.a and t1.b = t3.b
where t3.a IS NULL;

我知道这并没有回答您的问题,但是这种旧的连接语法是 where 子句中条件模糊的问题。不推荐,所以尽量避免:

于 2013-01-23T07:54:52.283 回答
0

where 子句中的顺序并不重要。ANSI JOIN 语法提高了可读性,但不影响性能。为了证明这一点:

create table t1 (a number, x number);
create table t2 (a number, b number);
insert into t1 (a, x) select level, mod(level,100) from dual connect by level <= 100000;
insert into t2 (a, b) select level, mod(level,10)  from dual connect by level <= 100000;
exec dbms_stats.gather_table_stats(user,'t1');
exec dbms_stats.gather_table_stats(user,'t2');
set autotrace trace explain

所有四个查询

select t1.a, t2.b from t1, t2 where t1.a=t2.b and t1.x > 5 and t2.b > 5;
select t1.a, t2.b from t1, t2 where t1.a=t2.b and t2.b > 5 and t1.x > 5;
select t1.a, t2.b from t1, t2 where t1.x > 5 and t2.b > 5 and t1.a=t2.b;
select t1.a, t2.b from t1 join t2 on t1.a=t2.b where t1.x > 5 and t2.b > 5;

产生完全相同的查询计划

Plan hash value: 282751716
---------------------------------------------------------------------------
| Id  | Operation          | Name | Rows  | Bytes | Cost (%CPU)| Time     |
---------------------------------------------------------------------------
|   0 | SELECT STATEMENT   |      | 44444 |   434K|    88   (7)| 00:00:02 |
|*  1 |  HASH JOIN         |      | 44444 |   434K|    88   (7)| 00:00:02 |
|*  2 |   TABLE ACCESS FULL| T2   | 44444 |   130K|    42   (5)| 00:00:01 |
|*  3 |   TABLE ACCESS FULL| T1   | 94946 |   649K|    44   (5)| 00:00:01 |
---------------------------------------------------------------------------

Predicate Information (identified by operation id):
---------------------------------------------------

   1 - access("T1"."A"="T2"."B")
   2 - filter("T2"."B">5)
   3 - filter("T1"."X">5 AND "T1"."A">5)
于 2013-01-23T08:17:18.590 回答
0

在基于成本的优化器 (CBO) 下,where 子句中谓词的顺序并不重要,因为 CBO 会很乐意按照它认为合适的方式重新排列谓词(除非您在其中提示告诉 oracle 不要这样做这个)。

对于基于规则的优化器来说,确实应该注意谓词的顺序,但希望您不是在仍然使用 RBO 的非常旧的 Oracle 版本上。

于 2013-01-23T08:01:56.747 回答