我有一个混合类型的数据集:连续的、二进制的、分类的。
我读过一些文章,使用“gower”是混合类型数据的一个很好的聚类距离。所以我想尝试一下并制作一个探索性热图(对行和列进行聚类)。对于一个最小的例子:
library(cluster)
data(agriculture)
agriculture$test <- as.factor(ifelse(agriculture$y %% 2 == 0, "yes", "no"))
head(agriculture)
x y test
B 16.8 2.7 no
DK 21.3 5.7 no
D 18.7 3.5 no
GR 5.9 22.2 no
E 11.4 10.9 no
F 17.8 6.0 yes
我可以使用gower_sample_dist <- daisy(agriculture, metric = "gower")
. 但是,如果我需要获取热图,我还需要对变量进行聚类,我无法使用gower_variable_dist <- daisy(t(agriculture), metric = "gower")
.
> daisy(t(agriculture), metric = "gower")
Error in daisy(t(agriculture), metric = "gower") :
x is not a dataframe or a numeric matrix.
有没有办法使用 获得关于变量的聚类/不相似矩阵gower
?
谢谢!