3

从命令行或脚本使用 jags.parallel 可以正常工作。我可以从http://www.inside-r.org/packages/cran/R2jags/docs/jags运行这个修改后的例子就好了

# An example model file is given in:
  model.file <- system.file(package="R2jags", "model", "schools.txt")
#=================#
# initialization  #
#=================#

  # data
  J <- 8.0
  y <- c(28.4,7.9,-2.8,6.8,-0.6,0.6,18.0,12.2)
  sd <- c(14.9,10.2,16.3,11.0,9.4,11.4,10.4,17.6)

  jags.data <- list("y","sd","J")
  jags.params <- c("mu","sigma","theta")
  jags.inits <- function(){
    list("mu"=rnorm(1),"sigma"=runif(1),"theta"=rnorm(J))
  }


#===============================#
# RUN jags and postprocessing   #
#===============================#
#  jagsfit <- jags(data=jags.data, inits=jags.inits, jags.params, 
#    n.iter=5000, model.file=model.file)

  # Run jags parallely, no progress bar. R may be frozen for a while, 
  # Be patient. Currenlty update afterward does not run parallelly

  print("Running Parallel") 
  jagsfit <- jags.parallel(data=jags.data, inits=jags.inits, jags.params, 
    n.iter=5000, model.file=model.file)

但是,如果我将它包装在一个函数中

testparallel <- functions(out){
# An example model file is given in:
    .
    .
    .
jagsfit <- jags.parallel(data=jags.data, inits=jags.inits, jags.params, 
  n.iter=5000, model.file=model.file)
print(out)
return(jagsfit)
}

然后我得到错误: get(name, envir = envir) 中的错误:找不到对象'y'根据我在这里找到的内容,我知道这是导出到集群的环境的问题,我已经通过更改修复了它

J <- 8.0
y <- c(28.4,7.9,-2.8,6.8,-0.6,0.6,18.0,12.2)
sd <- c(14.9,10.2,16.3,11.0,9.4,11.4,10.4,17.6)

  assign("J",8.0,envir=globalenv()) 
  assign("y",c(28.4,7.9,-2.8,6.8,-0.6,0.6,18.0,12.2),envir=globalenv()) 
  assign("sd",c(14.9,10.2,16.3,11.0,9.4,11.4,10.4,17.6),envir=globalenv()) 

有没有更好的方法来解决这个问题?

谢谢你,格雷格

附言

我正在为其他人编写此代码,因此我真的不想更改 R2jags 包中的内容以让我通过环境进行导出,尽管我计划将其建议给包的作者。

4

3 回答 3

5

所以我联系了 R2jags 的作者,他在 jags.parallel 中添加了一个附加参数,可以让你传递 envir,然后传递到 clusterExport。

这很好用,除了它允许我的数据名称和 jags.parallel 函数中的变量之间发生冲突。

于 2015-02-10T23:02:16.863 回答
0

如果您在并行中大量使用 JAGS,我建议您将包rjags与包结合起来查看dclone。我认为dclone它非常强大,因为语法与rjags. 我从来没有看到你这个包的问题。

如果你想使用R2jags我认为你需要将你的变量和你的 init 函数传递给带有函数的工作人员:

clusterExport(cl, list("jags.data", "jags.params", "jags.inits"))

于 2014-05-23T14:38:01.380 回答
0

在不更改代码的情况下R2jags,您仍然可以通过使用更简单的方式将这些数据变量分配给全局环境list2env

显然,人们担心这些变量名可能会在全局环境中被覆盖,但您可能可以对此进行控制。

下面是与原始帖子中给出的示例相同的代码,除了我将数据放入一个列表并使用该list2env函数将该列表的数据发送到全局环境中。(我还取出了函数中未使用的“out”变量。)这对我来说目前运行良好;不过,您可能必须添加更多链和/或添加更多迭代才能看到并行性。

testparallel <- function(){

    library(R2jags)

    model.file <- system.file(package="R2jags", "model", "schools.txt")

    # Make a list of the data with named items.
    jags.data.v2 <- list(
        J=8.0, 
        y=c(28.4,7.9,-2.8,6.8,-0.6,0.6,18.0,12.2),
        sd=c(14.9,10.2,16.3,11.0,9.4,11.4,10.4,17.6) )

    # Store all that data explicitly in the globalenv() as
    # was previosly suggesting using the assign(...) function.
    # This will do that for you.
    # Now R2jags will have access to the data without you having 
    # to explicitly "assign" each to the globalenv.
    list2env( jags.data.v2, envir=globalenv() )

    jags.params <- c("mu","sigma","theta")
    jags.inits <- function(){
        list("mu"=rnorm(1),"sigma"=runif(1),"theta"=rnorm(J))
    }

    jagsfit <- jags.parallel(
        data=names(jags.data.v2), 
        inits=jags.inits, 
        jags.params, 
        n.iter=5000, 
        model.file=model.file)

    return(jagsfit)
}
于 2015-02-10T02:32:04.870 回答