此相似度矩阵中的值基于 Jaccards 系数:
a, b, c
a, 1, .3, .6
b, .3, 1, .9
c, .6, .9, 1
为了生成聚类分析,我使用了以下代码:
tb = read.csv("c:\\Users\\Adrian\\Desktop\\sim-matrix.csv", row.names=1);
d = as.dist(tb);
hclust(d);
plot(hclust(d, method="average"));
生成此树状图:
- 为什么
a
&b
组合在一起 - 如何测量接近度?
- 凝聚法是否对, &
"average"
的相应值进行平均 ?a
b
c
?hclust
不提供任何细节