我正在尝试使用JD LongR
调用的包,我读过一本名为“ Parallel RSegue
”的书,它被誉为将 R 与 AWS 结合使用的终极简单方法。
然而,连续第二天我遇到了一个问题,我开始创建一个集群,它只是说STARTING
无限期。
我在 OS X 和 Linux 上尝试了这个,集群大小为 2、6、10、20 和 25。我让它们都运行了至少 6 个小时。我在 AWS EMR 管理控制台中启动集群没有问题,尽管我不知道如何连接Segue
/R
到在管理控制台中启动的集群,而不是通过createCluster()
.
所以我的问题是 - 是否有某种方法可以解决集群的配置问题,或者通过手动创建集群并以某种方式开始使用它来绕过问题Segue
?
这是我所看到的一个例子:
图书馆(转)
加载所需的包:rJava
加载所需的包:caTools
Segue 没有找到您的 AWS 凭证。请运行 setCredentials() 函数。
setCredentials("xxx", "xxx")
emr.handle <- createCluster(numInstances=10)
STARTING - 2013-07-12 10:36:44
STARTING - 2013-07-12 10:37:15
STARTING - 2013-07-12 10:37:46
STARTING - 2013-07-12 10:38:17
....这种情况持续了几个小时和几个小时......