4

我正在尝试使用ST_SnapToGrid,然后GROUP BY使用网格单元(x,y)。这是我首先做的:

SELECT
  COUNT(*)                      AS n,
  ST_X(ST_SnapToGrid(geom, 50)) AS x,
  ST_Y(ST_SnapToGrid(geom, 50)) AS y
FROM points
GROUP BY x, y

我不想ST_SnapToGridx和重新计算y。所以我将其更改为使用子查询:

SELECT
  COUNT(*)   AS n,
  ST_X(geom) AS x,
  ST_Y(geom) AS y
FROM (
  SELECT 
      ST_SnapToGrid(geom, 50) AS geom
  FROM points
) AS tmp
GROUP BY x, y

但是当我运行时EXPLAIN,这两个查询都有完全相同的执行计划:

GroupAggregate  (...)
  ->  Sort  (...)
        Sort Key: (st_x(st_snaptogrid(points.geom, 0::double precision))), (st_y(st_snaptogrid(points.geom, 0::double precision)))
        ->  Seq Scan on points  (...)

问题:PostgreSQL 会重用 的结果值ST_SnapToGrid()吗?
如果没有,有没有办法让它做到这一点?

4

1 回答 1

3

测试时间

您看不到EXPLAIN输出中每行单个函数的评估。

测试EXPLAIN ANALYZE以获取实际查询时间以比较整体有效性。运行几次以排除缓存工件。对于像这样的简单查询,您可以获得更可靠的总运行时间数字:

EXPLAIN (ANALYZE, TIMING OFF) SELECT ...

需要 Postgres 9.2+根据文档

TIMING

在输出中包括实际启动时间和在每个节点上花费的时间。在某些系统上,重复读取系统时钟的开销可能会显着减慢查询速度,因此FALSE在只需要实际行数而不是确切时间时设置此参数可能很有用。始终测量整个语句的运行时间,即使使用此选项关闭节点级计时也是如此。此参数只能在ANALYZE也启用时使用。它默认为TRUE.

防止重复评估

通常,子查询中的表达式只计算一次。但是如果 Postgres 认为这样会更快,它可以折叠琐碎的子查询。

要引入优化障碍,您可以使用CTE而不是子查询。这保证PostgresST_SnapToGrid(geom, 50)只计算一次:

WITH cte AS (
   SELECT ST_SnapToGrid(geom, 50) AS geom1
   FROM   points
   )
SELECT COUNT(*)   AS n
     , ST_X(geom1) AS x
     , ST_Y(geom1) AS y
FROM   cte
GROUP  BY geom1;         -- see below

但是,由于 CTE 的开销更大,这可能比子查询慢。函数调用可能非常便宜。通常,Postgres 更了解如何优化查询计划。如果您知道得更好,请仅引入这样的优化障碍。

简化

我在子查询/CTE 中更改了计算点的名称,geom1以澄清它与原来的不同geom。这有助于澄清这里更重要的事情:

GROUP BY geom1

代替:

GROUP BY x, y

这显然更便宜 - 并且可能会影响函数调用是否重复。所以,这可能是最快的:

SELECT COUNT(*) AS n
     , ST_X(ST_SnapToGrid(geom, 50)) AS x
     , ST_y(ST_SnapToGrid(geom, 50)) AS y
FROM   points
GROUP  BY ST_SnapToGrid(geom, 50);         -- same here!

或者也许是这样:

SELECT COUNT(*)    AS n
     , ST_X(geom1) AS x
     , ST_y(geom1) AS y
FROM (
   SELECT ST_SnapToGrid(geom, 50) AS geom1
   FROM   points
   ) AS tmp
GROUP  BY geom1;

EXPLAIN ANALYZE用or测试所有三个,EXPLAIN (ANALYZE, TIMING OFF)然后自己看看。测试>>猜测。

于 2014-02-18T19:20:09.000 回答