我有一些带有经纬度信息的数据,但大多数数据点在地理上都很密集,不具有代表性。我希望从这些数据集中挑选出一个具有均匀分布的代表性子集。
下面是我的数据示例
no lon lat
1 121.62 31.18
2 121.91 30.90
3 121.76 31.11
4 121.49 31.12
... ...
查了一些资料,学会了对经纬度分组,然后用皮尔逊卡方检验,但是对sql的使用不熟悉。
我希望得到 sql 代码来得到这样的子集或者更好地使用 sql 来得到均匀分布的方法。