3

我正在尝试doMC使用foreachand %dopar%。这是功能:

doTheMath_MC <- function(st, end, nd) {

    print(getDoParWorkers())    
    if (st > end) stop("end must be larger than st")

    # Helper function from stackoverflow.com/a/23158178/633251
    tr <- function(x, prec = 0) trunc(x * 10^prec) / 10^prec

    # Function to use with foreach
    fef <- function(i, j, num, trpi) {
        if (num[j] >= num[i]) return(NULL)
        val <- num[i]/num[j]
        if (!tr(val, nd) == trpi) return(NULL)
        return(c(i, j, tr(val, nd)))
        }

    # Here we go...

    nd <- nd - 1
    trpi <- tr(pi, nd)
    num <- st:end
    ni <- length(num)

    ans <- foreach(i = 1:ni, .combine = rbind) %:%
        foreach(j = 1:ni, .combine = rbind) %dopar% {
            fef(i, j, num, trpi)
            }
    cat("Done computing", paste("EST", st, end, nd+1, sep = "_"), "\n")
    if (is.null(ans)) return(NULL)
    ans <- as.matrix(na.omit(ans)) # probably not needed in MC version
    return(ans) # c("num", "den", "est", "eff")
    }

我之前已经设置了核心,另一个函数调用了上面的函数(这个信息发布在下面,我认为这不是问题)。 getDoParWorkers()报告已按预期分配了 7 个内核。该cat语句验证 2 个“循环”在输出范围内是否正常工作。但是,只使用了 1 个内核。有人知道为什么吗?Mac OSX 10.10.2 和 R 3.2 (2015-03-15 r67992)。最后,使用doParallel来控制一切会产生相同的结果。

设置一切的步骤:

mn <- 1
mx <- 10000
jmp <- 1000
mc <- TRUE

if (mc)     {
    require("doMC")
    registerDoMC(7)
    }

st <- seq(mn -1, mx - jmp, jmp) + 1
end <- seq(mn - 1 + jmp, mx, jmp)
nd <- rep(1:15, each = mx/jmp) # watch the recycling

df <- data.frame(st = st, end = end, nd = nd)

for (i in 1:nrow(df)) {
    findEsts(df$st[i], df$end[i], df$nd[i], MC = mc)
    }
4

1 回答 1

0

很抱歉回答我自己的问题!我改变了dopar处理方式,只有外部循环是并行的:

ans <- foreach(i = 1:ni, .combine = rbind) %dopar%
   for (j in 1:ni) {
   fef(i, j, num, trpi)
   }

而且,我根本没有要求足够的迭代。对于测试,我一直在使用mx = 10000and jmp = 1000(请参阅原始问题)。这些显然不足以触发并行处理。增加每 10 倍对于进行并行处理是必要的。感谢评论者!

注意:虽然上面的代码激活了并行处理,但它没有正确返回答案。那将是另一个问题的主题。

于 2015-03-18T22:59:56.713 回答