我有数百万个地理点。对于其中的每一个,我想找到所有“相邻点”,即某个半径内的所有其他点,比如几百米。
这个问题有一个简单的 O(N^2) 解决方案——只需计算所有点对的距离。但是,因为我正在处理适当的距离度量(地理距离),所以应该有一种更快的方法来做到这一点。
我想在 python 中做到这一点。想到的一种解决方案是使用一些数据库(带有 GIS 扩展的 mySQL,PostGIS),并希望这样的数据库能够使用一些索引有效地执行上述操作。不过,我更喜欢更简单的东西,这不需要我构建和学习这些技术。
几点
- 我将执行数百万次“查找邻居”操作
- 数据将保持静态
- 因为这个问题在某种意义上很简单,所以我想看看他们解决它的 python 代码。
就python代码而言,我想要一些类似的东西:
points = [(lat1, long1), (lat2, long2) ... ] # this list contains millions lat/long tuples
points_index = magical_indexer(points)
neighbors = []
for point in points:
point_neighbors = points_index.get_points_within(point, 200) # get all points within 200 meters of point
neighbors.append(point_neighbors)