1

我一直在研究在 EC2 上运行 R,但我想知道这个设置与并行/集群计算有什么关系。我环顾四周,但找不到有关此的教程。

基本上我想做的是让 R (Rstudio) 在我的笔记本电脑上运行,并完成大部分工作,但是当我有一个大的操作要运行时,明确地将它传递给一个 AWS 从属实例来完成所有工作繁重的工作。

据我所知,降雪/降雪​​套餐似乎是答案......但我不太确定如何。

我正在使用http://bioconductor.org/help/bioconductor-cloud-ami/(ssh之一)上的教程来运行 R。本教程确实提到了并行/集群,但它似乎是在不同的 AWS 实例之间。

任何帮助都会很棒。干杯。

4

1 回答 1

0

如果您只需要一个从属实例,我发现在实例上并行运行它而不是使用您的 PC 作为主实例是最简单的。

您可以在 PC 上编写脚本并将其推送到运行 R 的多核服务器,然后使用所有内核并行运行它。

例如,将此上传到 4 核 AWS 实例:

library(snowfall)
sfInit(parallel=TRUE,cpus=4,slaveOutfile="log.txt")

vars = c(1:100)

#send variables to all processors
sfExportAll()

#Run this in parallel
results = sfLapply(vars, exp)

#Stop parallel processing
sfStop()

#save results
save(results, file = "results.RData")
于 2014-01-07T16:26:53.517 回答