r - hcpc 和 hclust 函数对混合分类给出不同的结果

问问题 2015-06-01T10:01:31.587

819 次

我开始使用“hclust”对混合数据进行分层分类。但是，结果不包含有关每个集群的变量重要性的任何详细信息。这就是我使用“HCPC”进行分类的原因，它提供了所有这些细节。

我的问题是：为什么两个层次分类的结果不一样？（例如，在第一分类中，第一类中有 881 个人，而在第二分类中，第一类中有 679 个人）

dtf.year <- read.table(file="studies/dtf.year.txt", sep="\t", header=T)

#hclust
library(ade4)
year.afdm <- dudi.mix(dtf.year,scannf=F,nf=2)
dist.year <- dist(year.afdm$li[,1:2],method="euclidian")
dist.year <- dist.year^2
year.tree <- hclust(dist.year,method="ward.D") #I also tried ward.D2
year.clusters <- cutree(year.tree, k=3)
table(year.clusters)

>   1   2   3 
881 225 535 

#HCPC
library(FactoMineR)
year.afdm <- FAMD(dtf.year, ncp=2)
year.tree2 <- HCPC(year.afdm , method="ward",order=FALSE)
table(year.tree2$data.clust$clust)

>   1   2   3 
679 267 695

欢迎任何帮助！

最好的祝愿，唐'

r - hcpc 和 hclust 函数对混合分类给出不同的结果

0 回答 0

Related

Reference