我在飞机(一个城市)上有很多点(纬度和经度),我想找到两个集群。簇 1 是杂乱无章的点,簇 2 是其他所有点。
我知道问题的定义并不准确。唯一定义的是我需要正好 2 个集群。在 N 个点中,有多少最终在集群 1 或集群 2 中没有定义。
主要目的是识别彼此非常接近的点并将它们与其他点分开(分布更均匀)
我能想到的最好的算法是以下算法:
1. For each point, Calculate the sum of the square distances to all other points.
2. Run the k-means with k=2 on these square distances
距离的平方(甚至更高阶)应该有助于提高维度。然而,该算法将偏向城市中心附近的点。它很难在城市边缘找到集群。
关于如何避免这个问题的任何建议?以及任何其他改进此算法的建议