在下面的示例中,我尝试使用missForest 来估算缺失值。为了加快我使用 foreach 包的过程。在其中我使用了 100 棵树,然后我将这些树传递给了 missForest 函数。这是平行missForest的正确方法吗?
这是示例和我所做的:
library(foreach)
library(missForest)
data(iris)
iris.na <- iris
set.seed(111)
## artificially drop some data values.
for (i in 1:4) iris.na[sample(150, sample(20)), i] <- NA
set.seed(222)
system.time(rf <- foreach(ntree=100, .combine=combine,
.multicombine=TRUE,.packages='missForest') %dopar%
{ missForest(iris.na)$ximp})