4

我看到SELECT EXISTS很多使用:

    if db.query("""
        SELECT EXISTS (
            SELECT 1 FROM checkout
            WHERE checkout_id = %s
        )
    """ % checkout_id).getresult()[0][0] == 't':

与我更喜欢的相比:

    if db.query("""
        SELECT 1 FROM checkout
        WHERE checkout_id = %s
        LIMIT 1
    """ % checkout_id).getresult():

哪个是首选,为什么?

PS 我正在使用 Python 和 PosgreSQL。

cert=> explain SELECT EXISTS (SELECT 1 FROM checkout WHERE checkout_id = 3);
                                      QUERY PLAN                                      
--------------------------------------------------------------------------------------
 Result  (cost=4.03..4.03 rows=1 width=0)
   InitPlan
     ->  Index Scan using checkout_pkey on checkout  (cost=0.00..4.03 rows=1 width=0)
           Index Cond: (checkout_id = 3)
(4 rows)

cert=> explain SELECT 1 FROM checkout WHERE checkout_id = 3 limit 1;
                                     QUERY PLAN                                     
------------------------------------------------------------------------------------
 Limit  (cost=0.00..4.03 rows=1 width=0)
   ->  Index Scan using checkout_pkey on checkout  (cost=0.00..4.03 rows=1 width=0)
         Index Cond: (checkout_id = 3)
(3 rows)

我的意思是,为什么从结果中获取一行并检查它的第一列是否为真,如果我可以检查是否有任何行,意思相同?

4

3 回答 3

8

在我看来,第二个语句是有问题的,如果条件不满足,它不会返回一行。

于 2012-05-15T10:47:26.300 回答
2

当您使用时,EXPLAIN您可以看到第一条语句将执行额外的子查询,而第二条则不会。

这就是为什么我更喜欢使用limit而不是exists

例子:

explain SELECT EXISTS (SELECT 1 FROM checkout WHERE id = 3);
explain SELECT 1 FROM checkout WHERE id = 3 limit 1;
于 2012-05-15T10:44:20.497 回答
2

正如您在执行计划中清楚地看到的那样,PostgreSQL 似乎足够聪明地对待这两个语句。

我对具有 ~150000 行的本地表和根据条件从中选择 ~100 行的测试也显示出相同的行为

底线是:使用哪一个并不重要,但您应该意识到其他 DBMS 的行为方式可能不同。

于 2012-05-15T11:45:18.003 回答