1

我正在尝试在具有多个节点的计算中心运行条件逻辑回归,以评估 9.69 亿行的大数据集。但是计算取消了,因为作业超过了最大容量节点的最大内存 90GB。

我听说 R 包“Rmpi”可以在多个节点上运行计算。

我正在使用以下代码运行条件 logit 回归:

library(survival)
All <- read.table("/scratch/rvonscha/all.txt", header=TRUE, sep=";", na.strings="NA", dec=",", strip.white=TRUE)
attach(All)
model <- clogit(Alliance ~ OVB + BVB + CVC + EarlyStage + AvgVCSize +NumberVC + strata(Strata))
summary(model)

是否可以使用 Rmpi​​ 进行此计算,如果可以,我如何在代码中实现它?

我真的很感激任何帮助来解决这个问题。

非常感谢您提前。

4

0 回答 0