我有一个由 132 个观察值和 10 个变量组成的数据集。这些变量都是分类的。我试图根据方差百分比查看我的观察结果如何聚类以及它们有何不同。即我想知道a)是否有任何变量有助于将某些观察点彼此分开,b)如果是,它解释的方差百分比是多少?
有人建议我对我的数据运行 PCoA(原理坐标分析)。我使用 vegan 和 ape 包运行它。这是我将 csv 文件加载到 r 后的代码,我称之为数据
#data.dis<-vegdist(data,method="gower",na.rm=TRUE)
#data.pcoa<-pcoa(data.dis)
然后我被告知要从 pcoa 数据中提取向量,所以
#data.pcoa$vectors
然后它返回了 132 行但 20 列的值(例如,从轴 1 到轴 20)
当我只有 10 个变量时,我对为什么有 20 列值感到困惑。我的印象是我只会得到 10 列。如果有任何善良的灵魂可以帮助解释a)向量实际代表什么,b)我如何获得轴1和轴2解释的方差百分比?
我遇到的另一个问题是我并不真正理解从中提取特征值的目的,data.pcoa
因为我看到一些网站在他们的距离矩阵上运行 pcoa 后这样做,但没有进一步的解释。