1

我想使用 doMC 引擎运行以下代码:

who_wins<-function(probs_a,probs_b,delta_order=0,delta_down=0){
  #browser()
  team_a<-runif(5,0,1)
  team_b<-runif(5,0,1)
  sya<-syb<-0
  for(i in 1:5){
    for(j in 1:2){
      if(j==1){
        if(sya<syb){
          team_a[i]<-(1-delta_down)*team_a[i]
        } 
        team_a[i]<-(1-(i-1)*delta_order)*team_a[i]
        sya<-sya+(team_a[i]<probs_a[i])
      }
      else{
        if(syb<sya){
          team_b[i]<-(1-delta_down)*team_b[i]
        } 
        team_b[i]<-(1-(i-1)*delta_order)*team_b[i]
        syb<-syb+(team_b[i]<probs_b[i])
      }
    }
  }
  if(sya>syb){
    return(1)
  }
  else if(sya<syb){
    return(2)
  }
  else {
    return(0)
  }
}

library(doMC)
registerDoMC(8)

probs_a<-seq(.6,.8,length.out=5)
probs_b<-probs_a[5:1]
nsim<-20000

results<-foreach(icount(nsim), .combine=c) %dopar% {
    return(who_wins(probs_a,probs_b))
}

问题是在第一个工作人员启动后几秒钟,引擎会尝试启动剩余的工作人员。我看到所有处理器都出现了峰值,但它们都很快死掉,即使是第一个也是如此。然后,启动一个新进程,剩余的代码将通过这个单独的工作人员运行。

我尝试过使用不同的代码,引擎运行良好。但是对于这个特定的规则,它不会。

谁能告诉我发生了什么?提前致谢。

4

1 回答 1

3

在循环中添加一个Sys.sleep(0.01),我看到所有 8 个进程都“忙”了那个。完成后,主进程会保持忙碌一段时间。我假设从各个进程收集数据并将其组合成单个结果的开销与并行计算的实际收益具有相似的规模。如果您简单地将“计算”更改为return(1),您会发现这需要与您的计算一样长的时间,因此时间不是花在工作负载上,而是组装结果。

既不.inorder=FALSE也不使用doParallel而不是doMC改变这一点。但是,我认为这是foreach包中的一个问题,因为mclapply开销显着减少:

result <- unlist(mclapply(1:nsim, function(i) {
   return(who_wins(probs_a, probs_b))
}, mc.cores=8))
于 2012-07-02T13:21:37.867 回答