我有一个用例,其中两组数据与一个昂贵的空间谓词相连。为了使查询并行化,我将空间宇宙划分为瓦片(以数千为单位),这样只有属于同一瓦片的记录才需要使用空间谓词进行测试。查询如下:
SELECT ST_Area(ST_Intersection(A.polygon, B.polygon))
/ ST_Area(ST_Union( A.polygon, B.polygon)) AS a_ratio
FROM spatial_table_a A
JOIN spatial_table_b B ON ST_Intersects(A.polygon, B.polygon)
WHERE A.tilename = B.tilename;
理想情况下,查询计划应该根据 对记录进行散列,然后使用索引扫描连接或嵌套循环连接tilename
执行空间谓词检查。ST_Intersects
但是,我现在得到的是一个过早执行空间连接的次优计划。该计划如下图所示:
-> Hash Join (cost=759468.44..377874772.26 rows=2610 width=18)
Hash Cond: "outer"."?column4?" = "inner"."?column4?"
Join Filter: a.polygon && b.polygon AND _st_intersects(a.polygon, b.polygon)
-> Seq Scan on spatial_table_b b (cost=0.00..409556.95 rows=288816 width=1034)
-> Hash (cost=375827.86..375827.86 rows=283522 width=946)
-> Seq Scan on spatial_table_a a (cost=0.00..375827.86 rows=283522 width=946)
所以,我的问题是:如何强制查询优化器生成更好的计划(这基本上改变了连接顺序)?