我有一个服务器从移动设备(iphone)接收 GPS 数据,然后找到每个不同日期的数据来自的不同城市. 该应用程序每三个小时同步一次。由于我需要的粒度不是那么小——我对比城市“更小”的东西不感兴趣——我想说“这个人在这个或那个日期在这个或那个城市”。问题是,GPS 预热、精度差和接收到的大量数据(设备每十分钟收集一次数据,每 3 小时与服务器同步一次)有时会产生误报或错误数据 - 我有一个用户住在附近纽约/新泽西州的边界,我不断地从一个或另一个地方获得替代位置,即使他实际一天中的大部分时间都在远离边界的地方度过,所以他在家的那些时间不应该重要)。
我的问题是:我应该考虑哪些算法,我应该阅读哪些论文,或者,甚至,我应该用谷歌搜索哪些术语来找到一种方法,以帮助我摆脱每隔 n 小时同步的数据的噪音和误报和不需要比某个级别(在这种情况下为城市)更细化,并且在特定时间段内哪个重要?(把它想象成我正在计算不同日期对不同城市、州或国家的访问次数)。我正在考虑诸如“聚类”或“分解”数据之类的东西,但我对地理算法一无所知;)