7

我正在尝试使用雪在 R 中运行并行作业。我已经能够在旧版本的 R 和 snow 上毫无问题地运行极其相似的工作。R 包依赖项阻止我恢复。

会发生什么:我的工作在这一步终止parRapply,即节点第一次必须做任何没有报告的事情Sys.info()。错误消息如下:

Error in checkForRemoteErrors(val) : 
3 nodes produced errors; first error: cannot open the connection 
Calls: parRapply ... clusterApply -> staticClusterApply -> checkForRemoteErrors

规格: R 2.14.0、snow 0.3-8、RedHat Enterprise Linux Client 5.6 版。雪包已经构建在正确版本的 R 上。

详细信息: 以下代码似乎可以正常执行:

cl <- makeCluster(3)
clusterEvalQ(cl,library(deSolve,lib="~/R/library"))
clusterCall(cl,function() Sys.info()[c("nodename","machine")])

我是最终用户,而不是系统管理员,但我迫切需要有关可能出现问题的建议和见解。

4

1 回答 1

18

之所以出现这个神秘错误,是因为在程序执行期间请求的输入文件实际上并不存在。每个节点都会尝试加载此文件然后失败,但这只会导致“无法打开连接”消息。

这意味着几乎任何事情都可能导致“连接”错误。令人难以置信的烦人!

于 2011-12-17T20:52:54.307 回答