我想在 K-means 算法中使用马氏距离,因为我有 4 个高度相关的变量(0.85)
在我看来,在这种情况下最好使用马氏距离。
问题是我不知道如何在 R 中使用 K-means 算法来实现它。
我认为我需要在聚类步骤之前“伪造”它来转换数据,但我不知道如何。
我尝试了经典的kmeans,标准化数据的欧几里得距离,但正如我所说,相关性太多。
适合 <- kmeans(mydata.standardize, 4)
我也试图找到一个距离参数,但我认为它在 kmeans() 函数中不存在。
预期结果是一种将 K-means 算法与 Mahalanobis 距离一起应用的方法。