3

我刚刚完成了对多组数据的长时间运行分析(24 小时以上)。由于我很懒,不想处理多个R会话并将结果汇​​总在一起,所以我使用foreach.

分析返回一个充满结果(和中间对象)的环境,所以我试图将结果分配给全局环境,结果发现这不起作用。这里有一些代码来说明:

library(doMC)
library(foreach)
registerDoMC(3)

bigAnalysis <- function(matr) {
  results <- new.env()
  results$num1 <- 1
  results$m <- matrix(1:9, 3, 3)
  results$l <- list(1, list(3,4))

  return(results)
}

a <- new.env()
b <- new.env()
c <- new.env()

foreach(i = 1:3) %dopar% {
  if (i == 1) {
    a <<- bigAnalysis(data1)
    plot(a$m[,1], a$m[,2]) # assignment has worked here
  } else if (i == 2) {
    b <<- bigAnalysis(data2)
  } else {
    c <<- bigAnalysis(data3)
  }
}

# Nothing stored :(
ls(envir=a)
# character(0)

foreach之前(在函数内)使用全局赋值来填充我预先设置的数据矩阵(我不能很好地使用.combine),所以我认为这会起作用。

编辑:这似乎只在函数体内起作用:

f <- function() {
  foreach(i = 1:3) %dopar% {
    if (i == 1) {
      a <<- bigAnalysis(data1)
    } else if (i == 2) {
      b <<- bigAnalysis(data2)
    } else {
      c <<- bigAnalysis(data3)
    }
  }
  d <- new.env()
  d$a <- a
  d$b <- b
  d$c <- c
  return(d)
}

为什么这在函数中起作用,但在顶层环境中不起作用?

4

1 回答 1

3

您在循环中分配给全局变量的尝试foreach失败了,因为它们发生在由mclapply. 这些变量不会发送回主进程,因此它们会丢失。

你可以尝试这样的事情:

r <- foreach(i = 1:3) %dopar% {
  if (i == 1) {
    bigAnalysis(data1)
  } else if (i == 2) {
    bigAnalysis(data2)
  } else {
    bigAnalysis(data3)
  }
}

a <- r[[1]]
b <- r[[2]]
c <- r[[3]]
ls(a)

这使用了默认的 combine 函数,该函数返回列表中的三个环境对象。

在函数中执行foreach循环不会使其工作。但是,如果您没有调用,那么分配将起作用,registerDoMC这样您实际上是按顺序运行的。在这种情况下,您实际上是在对主进程的全局环境进行分配。

于 2013-09-13T19:43:51.543 回答