我试图用维度为 15'000 x 7 的数据集进行模糊 k 均值聚类。我首先尝试了函数 fanny,它花了 R 将近 7 个小时才得到结果(我也尝试了其他参数,但它总是很慢;用5'000 行的样本大约需要半小时)。使用 cmeans 函数需要 27 秒。cmeans 与 fanny 有何不同?这是我设置这两个功能的方法:
fn <- fanny(training, k=40, memb.exp=1.3, metric="manhattan")
cn <- cmeans(training, 40, iter.max=500, dist="manhattan", method="cmeans", m=1.3)
生成的成员资格相似但不等价。此外,如何计算 cmeans 中的中心?在范妮中,我使用以下内容:
cent <- matrix(NA,40,ncol(training))
for (k in 1:40){
cent[k,] <- colSums(fn$membership[,k]*training)/sum(fn$membership[,k])
}
将此应用于 cmeans,我得到的结果与 cmeans$centers 不同。
非常感谢!