3

在 R 的pvclust包中,有pvclust()函数。在函数帮助文件中提供的示例中,有函数:

boston.pp <- pvpick(boston.pv)

这应该打印出具有高 p 值的集群。这个函数的输出是:

$clusters
$clusters[[1]]
[1] "rm"   "medv"

$clusters[[2]]
[1] "zn"  "dis"

$clusters[[3]]
[1] "crim"    "indus"   "nox"     "age"     "rad"     "tax"     "ptratio" "lstat"  


$edges
[1] 3 5 9

我很难理解输出的含义,特别是因为我在聚类分析方面的技术背景非常有限。特别是,我不明白每个集群下名称向量的含义。有人可以为我解释一下吗?谢谢!

4

1 回答 1

0

https://cran.r-project.org/web/packages/pvclust/pvclust.pdf 描述了 pvclust:

对于表示为 (nxp) 矩阵或数据框的数据,我们假设数据是要聚类的 p 个对象的 n 个观测值。第 i 个行向量对应于这些对象的第 i 个观察值,第 j 个列向量对应于大小为 n 的第 j 个对象的样本

pvpick 的输出:

cluster - 字符串向量列表。每个向量对应于每个簇中对象的名称。

您是否绘制了 pvclust 输出的树状图?pvpickclusters输出仅列出某个集群中的内部点(pvclust 将波士顿数据集中的每一视为一个点),如果您绘制它,您将在树状图中看到这些点。 在此处输入图像描述

于 2015-12-09T10:15:38.387 回答