我是这个网站的新手,也是聚类分析的新手,所以如果我违反约定,我深表歉意。
我一直在使用 Cluster 3.0 执行具有欧几里得距离和平均链接的层次聚类分析。Cluster 3.0 输出一个 .gtr 文件,其中包含一个连接基因的节点及其相似度得分。我注意到 .gtr 文件中的第一行总是将一个基因与另一个基因联系起来,然后是相似度得分。但是,我如何重现这个相似度分数?
在我的数据集中,我有 8 个基因并创建一个距离矩阵,其中 d_{ij} 包含基因 i 和基因 j 之间的欧几里得距离。然后我通过将每个元素除以矩阵中的最大值来标准化矩阵。为了得到相似度矩阵,我从 1 中减去所有元素。但是,我的结果没有使用链接类型,并且与输出相似度得分不同。
我主要对链接如何影响第一个节点的相似性(两个最接近的基因的连接)以及如何计算相似性分数感到困惑。
谢谢!