我可以访问一个强大的大型集群。我是一名中规中矩的 R 程序员,但对 shell 命令(以及一般的终端命令,除了使用 ubuntu 需要做的基本事情之外)完全陌生。
我想使用这个集群在 R 中运行一堆并行进程,然后我想将它们组合起来。具体来说,我有一个类似的问题:
my.function <-function(data,otherdata,N){
mod = lm(y~x, data=data)
a = predict(mod,newdata = otherdata,se.fit=TRUE)
b = rnorm(N,a$fit,a$se.fit)
b
}
r1 = my.function
r2 = my.function
r3 = my.function
r4 = my.function
...
r1000 = my.function
results = list(r1,r2,r3,r4, ... r1000)
上面只是一个愚蠢的例子,但基本上我想并行做 1000 次,然后用 1000 个进程的所有结果做一些事情。
如何将 1000 个作业同时提交到集群,然后合并所有结果,就像代码的最后一行一样?
任何关于我使用 RTFM 的编写良好的手册/参考的建议也将受到欢迎。不幸的是,我找到的文件并不是特别容易理解。
提前致谢!