r - 优化循环

Question

我正在实施《统计学习的要素：数据挖掘、推理和预测》（Hashtle、Tibshirani、Friedman）一书中给出的示例。

我的目标是从两个二元正态分布中生成 10+10 个均值，然后使用前十个均值生成标记为“绿色”的点，其他十个均值生成“红色”点。必须从其生成点的二元高斯的平均值每次都必须随机选取。我对 R 不太熟悉，所以我使用了 for 循环，随着 n 变大，使用它会花费大量时间。这是我的代码：

Sigma = diag(2)
greenMeans= mvrnorm(n=10, c(1,0), Sigma)
redMeans= mvrnorm(n=10, c(0,1), Sigma)

n=1000000
green<- array(dim=c(n,2))
red<- array(dim=c(n,2))

for (i in 1:n)
        {
            newGreen<- mvrnorm(n=1,greenMeans[sample(c(1:10),1,replace=TRUE),], Sigma/5)
            newRed<- mvrnorm(n=1,redMeans[sample(c(1:10),1,replace=TRUE),], Sigma/5)
            green[i,1] <- newGreen[1]
            green[i,2] <- newGreen[2]
            red[i,1] <- newRed[1]
            red[i,2] <- newRed[2]
    }

score 0 · Accepted Answer

您可以完全跳过 for 循环并使用replicate，但不确定它有多快：

do_stuff = function() {
   newGreen<- mvrnorm(n=1,greenMeans[sample(c(1:10),1,replace=TRUE),], Sigma/5)
   newRed<- mvrnorm(n=1,redMeans[sample(c(1:10),1,replace=TRUE),], Sigma/5)         
   return(list(newGreen, newRed))
 }
replicate(10000, do_stuff)

r - 优化循环

1 回答 1

Related

Reference