1

我有这个查询来获取给定过滤器的行数,由于数据库太大,需要很长时间才能得到结果,有没有办法优化它我正在使用 postgresql 8.2

 SELECT COUNT(1) as numrows from ( select lower(column1) as column1, column2, column3, column4, sum(column5) as column5, sum(column6) as column6 
    from table_name tablename 
    where column_date >= 'SOME DATE' and column_date < 'SOME DATE' 
    group by lower(column1) as column1, column2, column3, column4 ORDER BY column5 desc) allRows

这是我通过 EXPLAIN Query 得到的

XN Aggregate  (cost=849751.05..849751.05 rows=1 width=0)
  ->  XN Subquery Scan allrows  (cost=805802.05..842426.22 rows=2929933 width=0)
        ->  XN HashAggregate  (cost=805802.05..813126.89 rows=2929933 width=26)
              ->  XN Seq Scan on table_name tablename   (cost=0.00..512808.79 rows=29299326 width=26)
                    Filter: ((column_date < 'SOME DATE'::date) AND (column_date >= 'SOME DATE'::date))
4

1 回答 1

1

正如@Richard 已经评论的那样,优化性能的最佳方法是升级到当前版本的 PostgreSQL 。8.2 早就死了,被遗忘了,几乎跟不上。这也是一个安全风险。

此外,摆脱sum()计算 和ORDER BY,因为两者都对结果没有贡献。实际上,整个SELECT列表是没有用的。

SELECT COUNT(*) AS numrows
FROM  (
   SELECT 1
   FROM   table_name
   WHERE  column_date >= 'SOME DATE'
   AND    column_date <  'SOME DATE' 
   GROUP  BY lower(column1), column2, column3, column4
   ) sub

除此之外,您的 EXPLAIN 输出表明您缺少如下索引

CREATE INDEX table_name_column_date_idx ON table_name(column_date);
于 2013-09-24T13:09:38.047 回答