我在 Amazon EC2 上使用 RStudio 0.97.320 (R 2.15.3)。我的数据框有 200k 行和 12 列。
我试图用大约 1500 个参数拟合逻辑回归。
R 使用 7% 的 CPU 并拥有 60+GB 的内存,并且仍然需要很长时间。
这是代码:
glm.1.2 <- glm(formula = Y ~ factor(X1) * log(X2) * (X3 + X4 * (X5 + I(X5^2)) * (X8 + I(X8^2)) + ((X6 + I(X6^2)) * factor(X7))),
family = binomial(logit), data = df[1:150000,])
有什么建议可以大大加快速度吗?