我一直在运行 sci-kit learn 的 DBSCAN 实现,以按纬度/经度对一组地理标记照片进行聚类。在大多数情况下,它工作得很好,但我遇到了一些令人费解的例子。例如,有两组照片,用户输入的文本字段指定照片是在中央公园拍摄的,但这些照片的纬度/经度没有聚集在一起。照片本身证实了他们两组观察结果都来自中央公园,但实际上纬度/经度之间的距离比epsilon
.
经过一番调查,我发现这是因为纬度/经度地理标签(由手机的 GPS 生成)非常不精确。当我查看每张照片的定位精度时,我发现它们的范围很广(我已经看到了高达 600 米的误差范围),如果考虑到定位精度,这两组照片在以纬度/经度表示的附近距离。
当您进行 DBSCAN 时,有什么方法可以计算 lat/long 的误差范围?
(注意:我不确定这个问题是否像它应该的那样清晰,所以如果我能做些什么来使它更清楚,请告诉我。)