1

我有包含数字和分类属性的混合数据类型矩阵Data_string大小 (947 x 41)。

我使用 daisy() 函数和 Rstudio 中的 Gower 距离测量生成了一个距离矩阵 (947 x 947)。

d  <- daisy(Data_String, metric = "gower", stand = FALSE,type = list(symm = c("V1","V13") , asymm = c("V8","V9","V10")))

我使用相异矩阵 (d) 应用了层次聚类。

# hclust
hc <- hclust(d, method="complete")
plot(hc)
rect.hclust(hc, 4)
cut <- cutree(hc, k = 1:5)
View(cut)

#Diana
d_as <- as.matrix(d)
DianaCluster <- diana(d_as, diss = TRUE, keep.diss = TRUE)
print(DianaCluster)
plot(DianaCluster)

以下是我的地块。

戴安娜情节

hclust_plot

** 注意:由于我没有足够的声望点,我无法在此处上传图片。

我正在努力理解结果,任何人都可以请

1-建议我可以在 R 中应用的任何解决方案,以简化对我的结果的理解。

或者

2-我如何将它链接到我的源数据,因为所有结果都基于相异矩阵。

4

1 回答 1

1

请看一下 - https://stats.stackexchange.com/questions/130974/how-to-use-both-binary-and-continuous-variables-together-in-clustering

它解释了如何在 hclust 中使用 gower 相异矩阵。希望这可以帮助!

于 2017-09-14T19:33:24.920 回答