python - 从地理数据中获取“最强”集群

问问题 2022-02-17T10:25:22.543

19 次

我正在设计一种算法来处理坐标集。每个用户都有一个坐标列表（纬度和经度），并且每次他/她执行操作时都会在列表中添加一个新坐标对。大多数情况下，点会非常集中，但可能会发生数据有一些分散的点，或者它们集中在两个不同的点周围。我的集群实际上应该很小，这些集群中的两个中心不太可能在 500m 之内。

我的目标是为每个用户找到最强的集群，最强的意思是其中得分最多的集群。

我的问题是，当数据像这样间隔时，您认为最好的方法是什么？我正在考虑k-means或k-medoids，但可能还有其他算法更适合这些数据。

我主要担心的一个事实是，大多数分散点不应该属于任何集群，也不应该自己构成集群，所以我不确定这两种算法处理这些异常值的效率如何。

0 回答 0