1

我正在使用vars库在 R 中运行向量自回归模型,我想利用该foreach函数并行运行模型,但它会产生错误提示

Error in { : task 1 failed - "object 'exogen.train' not found"

如果没有包含外生变量,则代码运行良好,但是一旦我将它们添加到模型中,就会发生错误。以下是错误的最小示例:

library(vars)
library(doParallel)

set.seed(123)
dat <- ts(matrix(rnorm(600), 200, 3), start = c(1961, 1), frequency = 12)
dat.train <- dat[1:100, ]
dat.test <- dat[101:200, ]

label <- sample(1:5, nrow(dat), replace = T)
exogen.train <- cbind(label = label[1:100])
exogen.test <- cbind(label = label[101:200])

ncores <- 6
cl <- makeCluster(ncores)
registerDoParallel(cl)

res <- foreach(i = 1:6, .combine = rbind, .packages = c("vars")) %dopar% {
    fit.VAR <- VAR(dat.train, p = i, type = "none", exogen = exogen.train)
    
    pred.valid <- predict(fit.VAR, dat.test, dumvar = exogen.test, n.ahead = nrow(dat.test))
    res <- lapply(pred.valid$fcst, sd)
    return(list(c(i, res)))
}
stopCluster(cl)
res

即使我将所有内容都移到循环中,错误仍然存​​在。但如果不包含外生变量,则代码运行良好:

ncores <- 6
cl <- makeCluster(ncores)
registerDoParallel(cl)

res <- foreach(i = 1:6, .combine = rbind, .packages = c("vars")) %dopar% {
    fit.VAR <- VAR(dat.train, p = i, type = "none")
    
    pred.valid <- predict(fit.VAR, dat.test, n.ahead = nrow(dat.test))
    res <- lapply(pred.valid$fcst, sd)
    return(list(c(i, res)))
}
stopCluster(cl)
res

在 Windows 和 Mac 上使用 R 4.2 以及在 Linux 上使用 R 3.62 可以重现该错误。

4

1 回答 1

1

这显然是VAR()内部尝试exogen从全局环境再次访问的函数的一些问题。请参阅此处的线程。

因此,您的解决方案是添加.GlobalEnv$exogen.train <- exogen.train到您的循环中:

res <- foreach(i = 1:6, .combine = rbind, .packages = c("vars")) %dopar% {
  .GlobalEnv$exogen.train <- exogen.train
  fit.VAR <- VAR(dat.train, p = i, type = "none", exogen = exogen.train)
  pred.valid <- predict(fit.VAR, dat.test, dumvar = exogen.test, n.ahead = nrow(dat.test))
  res <- lapply(pred.valid$fcst, sd)
  return(list(c(i, res)))
}
于 2020-08-04T09:25:38.977 回答