0

这是在此处生成的随机数据集,用于理解和绘制 R 中的层次聚类。我需要知道为什么对绘图的 x 和 y 轴调用 rnorm 的差异背后的逻辑。为什么 y<-rnorm(12, mean=rep(c(1,2,1)) 而我本来期望 mean=rep(c(1,2,3)。也许只是直译会帮助我。

set.seed(1234); par(mar=c(0,0,0,0)) ## par sets parameter mar (sets margin)  
x<-rnorm(12, mean=rep(1:3,each=4),sd=0.2) ## repeat the vector 3 times
y<-rnorm(12, mean=rep(c(1,2,1),each=4),sd=0.2) ## ?????
plot(x,y,col="blue",pch=19,cex=2)
text(x+0.05,y+0.05,label=as.character(1:12))

任何帮助表示赞赏!

4

1 回答 1

1

如果你运行你的代码,你会得到如下所示的图形输出:

集群

x您可以看到在三个不同的平均值(1、2 和 3)处存在三个集群,但只有两个不同的y值(1 和 2,然后又是 1)。那是因为y值的代码具有mean=rep(c(1,2,1),each=4). 即该rnorm函数正在生成十二个随机y值,其中前四个的平均值为 1,第二个四个的平均值为 2,第三个四个的平均值为 1。

于 2013-02-11T20:13:38.420 回答