我想将我的数据聚类为 5 个聚类,然后我们需要从所有数据中选择 50 个关系最不相似的个体。这意味着如果集群一个包含 100,两个包含 200,三个包含 400,四个包含 200,五个 100,我必须从第一个集群中选择 5 + 从第二个集群中选择 10 + 从第三个集群中选择 20 + 从第四个中选择 10 + 5 从第五。
数据示例:
mydata<-matrix(nrow=100,ncol=10,rnorm(1000, mean = 0, sd = 1))
到目前为止,我所做的是对数据进行聚类并对每个聚类中的个体进行排名,然后将其导出到 Excel 并从那里开始……这已经成为一个问题,因为我的数据变得非常大。
对于如何在 R 中应用之前的任何帮助或建议,我将不胜感激。