我有一个场景:我有一些 GPS 轨迹(经度、纬度)的数据,这些数据包含在 2 个部分中
第一部分包含作为旅程站的数据(经度和纬度)(这些是实际坐标,必须在巴士开始旅程时访问它们)
第二部分包含 GPS 坐标(经度和纬度),但可能是第一部分的 2 倍。每次巴士开始行程时,它都会停止这些车站(已给出坐标)。我想比较那辆公共汽车是否完成了它的旅程,或者不是通过比较它访问过的 GPS 站(实时坐标)与第一部分(预定坐标)。
但我的问题:
我在第二部分几乎有双坐标,所有坐标都非常接近,几乎 5-8 个坐标代表同一个站点..(例如 104578,105888)和(104579,105890)
什么是正确和可能的方式来宣布某些坐标代表同一个电台。这个问题可能可以通过某种方式使用 K 最近邻或 K 均值来解决。
这个问题似乎没有很好的定义..但我认为在查询时我会尝试解释更多。