4

我开始更好地掌握 PostgreSQL 索引,但是我遇到了 OR 条件的问题,我不知道如何优化我的索引以获得更快的查询。

我有 6 个条件,当单独运行时,它们的成本似乎很小。这是一个修剪查询的示例,包括查询计划计算时间。

注意:为了降低复杂性,我没有在下面输出这些查询的实际查询计划,但它们都使用nested loop left joins并且index scans正如我所期望的正确索引。如有必要,我可以包含查询计划以获得更有意义的响应. )

EXPLAIN ANALYZE SELECT t1.*, t2.*, t3.*
  FROM t1 LEFT JOIN t2 on t2.id = t1.t2_id LEFT JOIN t3 ON t3.id = t1.t3_id
 WHERE (conditions1)
 LIMIT 10;

QUERY PLAN
-------------------------------------------------------------------------------------
Limit  (cost=0.25..46.69 rows=1 width=171) (actual time=0.031..0.031 rows=0 loops=1)

EXPLAIN ANALYZE SELECT t1.*, t2.*, t3.*
  FROM t1 LEFT JOIN t2 on t2.id = t1.t2_id LEFT JOIN t3 ON t3.id = t1.t3_id
 WHERE (conditions2)
 LIMIT 10;

QUERY PLAN
-------------------------------------------------------------------------------------
Limit  (cost=0.76..18.97 rows=1 width=171) (actual time=14.764..14.764 rows=0 loops=1)

/* snip */

EXPLAIN ANALYZE SELECT t1.*, t2.*, t3.*
  FROM t1 LEFT JOIN t2 on t2.id = t1.t2_id LEFT JOIN t3 ON t3.id = t1.t3_id
 WHERE (conditions6)
 LIMIT 10;

QUERY PLAN
-------------------------------------------------------------------------------------
Limit  (cost=0.51..24.48 rows=1 width=171) (actual time=0.252..5.332 rows=10 loops=1)

我的问题是我想将这 6 个条件与 OR 运算符结合在一起,使每个条件成为可能。我的组合查询看起来更像这样:

EXPLAIN ANALYZE SELECT t1.*, t2.*, t3.*
  FROM t1 LEFT JOIN t2 on t2.id = t1.t2_id LEFT JOIN t3 ON t3.id = t1.t3_id
 WHERE (conditions1 OR conditions2 OR conditions3 OR conditions4 OR conditions5 OR conditions 6)
 LIMIT 10;

不幸的是,这导致查询计划大幅增加,似乎不再使用我的索引(相反,选择执行 ahash left join而不是 a ,并在以前使用的基础上nested loop left join执行各种操作)。sequence scansindex scans

Limit  (cost=142.62..510755.78 rows=1 width=171) (actual time=30.591..30.986 rows=10 loops=1)

关于 OR-ed 条件的索引,我应该知道什么特别的东西可以改善我的最终查询?

更新:如果我对每个单独的 SELECT 使用 UNION,这似乎可以加快查询速度。但是,如果我将来选择订购我的结果,这会阻止我吗?这是我通过 UNION 加快查询速度所做的工作:

EXPLAIN ANALYZE
SELECT t1.*, t2.*, t3.*
  FROM t1 LEFT JOIN t2 on t2.id = t1.t2_id LEFT JOIN t3 ON t3.id = t1.t3_id
 WHERE (conditions1)
UNION
SELECT t1.*, t2.*, t3.*
  FROM t1 LEFT JOIN t2 on t2.id = t1.t2_id LEFT JOIN t3 ON t3.id = t1.t3_id
 WHERE (conditions2)
UNION
SELECT t1.*, t2.*, t3.*
  FROM t1 LEFT JOIN t2 on t2.id = t1.t2_id LEFT JOIN t3 ON t3.id = t1.t3_id
 WHERE (conditions3)
UNION
SELECT t1.*, t2.*, t3.*
  FROM t1 LEFT JOIN t2 on t2.id = t1.t2_id LEFT JOIN t3 ON t3.id = t1.t3_id
 WHERE (conditions4)
UNION
SELECT t1.*, t2.*, t3.*
  FROM t1 LEFT JOIN t2 on t2.id = t1.t2_id LEFT JOIN t3 ON t3.id = t1.t3_id
 WHERE (conditions5)
UNION
SELECT t1.*, t2.*, t3.*
  FROM t1 LEFT JOIN t2 on t2.id = t1.t2_id LEFT JOIN t3 ON t3.id = t1.t3_id
 WHERE (conditions6)
 LIMIT 10;

QUERY PLAN
-------------------------------------------------------------------------------------
Limit  (cost=219.14..219.49 rows=6 width=171) (actual time=125.579..125.653 rows=10 loops=1)
4

2 回答 2

5

根据条件,使用任何索引来帮助使用OR表达式的复杂条件在逻辑上可能是不可能的。

像 MySQL,PostgreSQL 8.0 和更早的状态在他们的索引文档中

请注意,查询或数据操作命令每个表最多可以使用一个索引。

在 PostgreSQL 8.1 中,这种情况发生了变化

但是,如果这没有帮助,您可以使用UNION您尝试过的解决方案(这是 MySQL 用户的常见解决方案,它仍然具有每个表一个索引的限制)。

您应该能够对UNION查询的结果进行排序,但是您必须使用括号来指定它ORDER BY适用于 的结果UNION,而不仅仅是链中的最后一个子查询。

(SELECT ... )
UNION
(SELECT ... )
UNION
(SELECT ... )
ORDER BY columnname;

我希望这有帮助; 我不是 PostgreSQL 优化器方面的专家。您可以尝试搜索邮件列表档案,或在IRC 频道上询问。

于 2009-11-05T01:54:28.197 回答
2

(对不起 - 不知道如何回复回复,所以这是顶级的)

澄清一下 - PG 过去只对单个表扫描使用单个索引。如果您有一个连接三个表的查询,并且每个表都有一个有用的索引,那么使用所有三个表总是足够聪明。

在您的特定情况下,可能发生的是您的 ORed 条件之间存在某种联系。PostgreSQL 不知道这一点,因此最终假设它将匹配比实际更多的行。足够的行来更改您的查询计划。

此外,您的 UNIONed 查询与单个查询并不完全相同,因为您单独限制每个小的查询,而不是使用 UNION 限制整个结果集。

您应该能够对 UNION 查询的结果进行排序,但是您必须使用括号来指定 ORDER BY 应用于 UNION 的结果,而不仅仅是链中的最后一个子查询。

这是不对的 - ORDER BY 适用于整个结果。

高温高压

于 2009-11-06T15:39:23.487 回答