我正在使用sparcl
Witten 和 Tibshirani 根据他们的论文编写的包:
Witten DM 和 R Tibshirani (2010) 聚类中的特征选择框架。美国统计协会杂志 105(490): 713-726
我查看了函数下的示例HierarchicalSparseCluster
:
# Generate 2-class data
set.seed(1)
x <- matrix(rnorm(100*50),ncol=50)
y <- c(rep(1,50),rep(2,50))
x[y==1,1:25] <- x[y==1,1:25]+2
# Do tuning parameter selection for sparse hierarchical clustering
perm.out <- HierarchicalSparseCluster.permute(x, wbounds=c(1.5,2:6),nperms=5)
# Perform sparse hierarchical clustering
sparsehc <- HierarchicalSparseCluster(dists=perm.out$dists, wbound=perm.out$bestw, method="complete")
现在我检查dim(sparsehc$dists)
并返回 4950 和 50。从模拟设置中,我们知道n=100
和p=50
。此外,根据手册,返回值dists
是数据矩阵的(n*n)xp相异矩阵x
。显然,行维度不是 n*n,因为它应该是 100*100=10000 而不是 4950。我误解了什么吗?非常感谢你!