4

我正在尝试对从科学数据产生的数据矩阵进行聚类。我知道我希望如何完成聚类,但不确定如何在 R 中完成这一壮举。

以下是数据的样子:

            A1     A2     A3     B1     B2     B3     C1     C2     C3
sample1      1      9     10      2      1     29      2      5     44
sample2      8      1     82      2      8      2      8      2     28
sample3      9      9     19      2      8      1      7      2     27

请考虑 A1、A2、A3 是单个处理的三个重复,B 和 C 也是如此。Sample1 是不同的测试变量。所以,我想对这个矩阵进行层次聚类,以查看列之间的所有差异,特别是我将制作一个树状图(树)来观察列的相关性。

有谁知道如何适当地聚集这样的东西?我试着这样做:

raw.data <- read.delim("test.txt",header=FALSE,stringsAsFactors=FALSE)
dist.mat<-vegdist(raw.data,method="jaccard")
clust.res<-hclust(dist.mat)
plot(clust.res)

...但是,这导致每个样本变量都有一个分支,而不是每一列。感谢您的任何建议!

4

1 回答 1

4

只需转置您的数据集:

raw.data <- t(raw.data)
require(vegan)
dist.mat<-vegdist(raw.data,method="jaccard")
clust.res<-hclust(dist.mat)
plot(clust.res)
于 2013-08-08T19:11:33.693 回答