3

我有两张表,比如 A 和 B,其中包含两列的城市信息:纬度和经度。A 包含 100,000 条记录,B 包含 1,000,000 条记录。我的目标是找到距离 A 1 公里以内的 B 行(对于 A 中的每一行)。我该如何有效地做到这一点?我的目标是不到 30 分钟。

以下查询需要永远(我相信这是 100,000 * 1,000,000 = 1000 亿行比较的叉积的结果!):

select *
from A
inner join B
on is_nearby(A.latitude, A.longitude, B.latitude, B.longitude)

is_nearby()只是一个简单的函数,可以找到纬度和经度之间的差异。

我对A的一排做了测试,每排大约需要5秒。根据我的计算,查询完成执行需要几个星期,这是不可接受的。

4

1 回答 1

3

是的,PostGIS 会让事情变得更快,因为它 (a) 知道如何将纬度和经度转换为公里(我将使用下面的地理类型),并且 (b) 支持GiST 索引,这对于 GIS 来说是最佳的。

假设您的系统上有 PostGIS 版本 2,请升级您的数据库和表:

CREATE EXTENSION postgis;

-- Add a geog column to each of your tables, starting with table A
ALTER TABLE A ADD COLUMN geog geography(Point,4326);
UPDATE A SET geog = ST_MakePoint(longitude, latitude);
CREATE INDEX ON A USING GIST (geog);
--- ... repeat for B, C, etc.

现在找到距离 A 1 公里以内的 B 行(对于 A 中的每一行):

SELECT A.*, B.*, ST_Distance(A.geog, B.geog)/1000 AS dist_km
FROM A
JOIN B ON ST_DWithin(A.geog, B.geog, 1000);
于 2013-01-06T23:24:49.963 回答