0

我正在尝试使用 cluster::daisy 函数和相异矩阵对数据进行聚类。数据如下图所示。

> head(score_mat_unique_3)
         ID_1       ID_2    Score
1: 1000035849 1000532512 2.49e-60
2: 1000035849 1000682765 3.87e-08
3: 1000086994 1000658924 8.90e-18
4: 1000234640 1000535109 1.20e-87
5: 1000235015 1000754236 6.29e-34
6: 1000258002 1000598768 8.34e-36

分数显示了对象的不同程度(值越大,对象越多。),所以我使用了相异矩阵和菊花函数。

diss3 <- daisy(score_mat_unique_3, metric = "gower")

但是当我尝试绘制 hclust 时,会打印一些数字而不是 ID。

fit3 <- hclust(diss3, method = "ward.D2")
plot(fit3)

在此处输入图像描述 因此,关于簇中对象的信息丢失了。如何返回有关初始 ID 的信息并了解集群中的哪些 ID?

4

1 回答 1

0

您只需要使用labels参数来plot. 由于您不提供数据,因此我将使用内置的虹膜数据进行说明。

DAT = iris[sample(26),1:4]
fit3 = hclust(dist(DAT))

plot(fit3, labels=LETTERS)

带标签的树状图

在你的情况下,试试plot(fit3, labels=score_mat_unique_3$ID_1)

于 2020-07-02T12:32:32.737 回答