0

我正在设计一种算法来处理坐标集。每个用户都有一个坐标列表(纬度和经度),并且每次他/她执行操作时都会在列表中添加一个新坐标对。大多数情况下,点会非常集中,但可能会发生数据有一些分散的点,或者它们集中在两个不同的点周围。我的集群实际上应该很小,这些集群中的两个中心不太可能在 500m 之内。

我的目标是为每个用户找到最强的集群,最强的意思是其中得分最多的集群。

我的问题是,当数据像这样间隔时,您认为最好的方法是什么?我正在考虑k-meansk-medoids,但可能还有其他算法更适合这些数据。

我主要担心的一个事实是,大多数分散点不应该属于任何集群,也不应该自己构成集群,所以我不确定这两种算法处理这些异常值的效率如何。

4

0 回答 0