我正在使用包中的brm
函数计算负二项式回归brms
。由于这需要相当长的时间,我想按照文档中的建议使用多个内核。
bfit_s <- brm(
dep_var ~ ind_var +
var1 +
var2 +
(1 | some_level1) + (1 | some_level2),
data = my_df,
family = negbinomial(link = "log", link_shape = "log"),
cores = 4,
control = list(adapt_delta = 0.999)
)
但是,我遇到了一个错误,说所有四个工作人员的连接都失败了:
Compiling the C++ model
Start sampling
starting worker pid=11603 on localhost:11447 at 14:13:56.193
starting worker pid=11601 on localhost:11447 at 14:13:56.193
starting worker pid=11602 on localhost:11447 at 14:13:56.198
starting worker pid=11604 on localhost:11447 at 14:13:56.201
Error in unserialize(node$con) : error reading from connection
Calls: <Anonymous> -> slaveLoop -> makeSOCKmaster
Error in unserialize(node$con) : error reading from connection
Calls: <Anonymous> -> slaveLoop -> makeSOCKmaster
Error in unserialize(node$con) : error reading from connection
Calls: <Anonymous> -> slaveLoop -> makeSOCKmaster
Execution halted
Execution halted
Execution halted
Error in unserialize(node$con) : error reading from connection
Calls: <Anonymous> -> slaveLoop -> makeSOCKmaster
Execution halted
回溯说Error in makePSOCKcluster(names = spec, ...) : Cluster setup failed. 4 of 4 workers failed to connect.
我试图理解这个问题,阅读了一些关于 SO 这样的问题,但无法弄清楚为什么我无法连接。我正在使用 macOS Mojave,问题不在于我尝试使用比可能更多的内核。关于如何让它在多个核心上运行的任何建议?
编辑:正如 sjp 在他的回答中指出的那样,RStudio 存在问题。我想我在我的问题中分享了解决问题的代码,所以每个偶然发现的人都可以解决这个问题,而无需进一步点击(和阅读)。
问题是parallel
来自 R-4.0.0 的包。- 但是这个stan 论坛的用户提供了一种解决方法。如果您可以 setup_strategy="sequential"
这样初始化集群:
cl <- parallel::makeCluster(2, setup_strategy = "sequential")
您可以向您添加一个简短的片段,~/.Rprofile
以使这种默认设置:
## WORKAROUND: https://github.com/rstudio/rstudio/issues/6692
## Revert to 'sequential' setup of PSOCK cluster in RStudio Console on macOS and R 4.0.0
if (Sys.getenv("RSTUDIO") == "1" && !nzchar(Sys.getenv("RSTUDIO_TERM")) &&
Sys.info()["sysname"] == "Darwin" && getRversion() == "4.0.0") {
parallel:::setDefaultClusterOptions(setup_strategy = "sequential")
}