我是使用并行包的新手,并且已经开始探索它们以加快我的一些工作。我经常遇到的一个烦恼是,foreach
当我没有clusterExport
相关的函数/变量时,该命令会引发问题。
例子
我知道下面的示例不一定需要foreach
使其快速,但为了说明起见,我将使用它。
library(doParallel)
library(parallel)
library(lubridate)
library(foreach)
cl <- makeCluster(c("localhost", "localhost", "localhost","localhost"), type = "SOCK")
registerDoParallel(cl, cores = 4)
Dates <- sample(c(dates = format(seq(ISOdate(2010,1,1), by='day', length=365), format='%d-%m-%Y')), 500, replace = TRUE)
foreach(i = seq_along(Dates), .combine = rbind) %dopar% dmy(Dates[i])
Error in dmy(Dates[i]) : task 1 failed - "could not find function "dmy""
如您所见,有一个错误提示dmy
找不到该函数。然后我必须继续添加以下内容:
clusterExport(cl, c("dmy"))
所以我的问题是,除了查看错误以获取有关导出什么的线索之外,是否有一种更优雅的方法可以预先知道要导出哪些对象,或者有没有办法在运行之前与所有从属共享全局环境foreach
?