7

我是使用并行包的新手,并且已经开始探索它们以加快我的一些工作。我经常遇到的一个烦恼是,foreach当我没有clusterExport相关的函数/变量时,该命令会引发问题。

例子

我知道下面的示例不一定需要foreach使其快速,但为了说明起见,我将使用它。

library(doParallel)
library(parallel)
library(lubridate)
library(foreach)

cl <- makeCluster(c("localhost", "localhost", "localhost","localhost"), type = "SOCK")
registerDoParallel(cl, cores = 4)

Dates <- sample(c(dates = format(seq(ISOdate(2010,1,1), by='day', length=365), format='%d-%m-%Y')), 500, replace = TRUE)

foreach(i = seq_along(Dates), .combine = rbind) %dopar% dmy(Dates[i])

Error in dmy(Dates[i]) : task 1 failed - "could not find function "dmy""

如您所见,有一个错误提示dmy找不到该函数。然后我必须继续添加以下内容:

clusterExport(cl, c("dmy"))

所以我的问题是,除了查看错误以获取有关导出什么的线索之外,是否有一种更优雅的方法可以预先知道要导出哪些对象,或者有没有办法在运行之前与所有从属共享全局环境foreach

4

1 回答 1

2

无需像那样手动导出单个包功能。您可以使用函数的.packages参数foreach来加载所需的包,因此所有包函数都可用于您的%dopar%表达式。

于 2012-05-21T16:01:09.293 回答