0

我正在使用 R 来选择最佳拟合模型的项目。

我有 15 个变量,样本量为 790,000。线性模型不起作用 b/c 残差不是随机的和非正态的。

所以我尝试运行具有更高多项式和交互作用的非线性模型。但是,由于数据集很大,R 非常慢并且不时关闭。

我尝试使用逐步函数 polym 函数,但都不是理想的。是否有用于高阶多项式和交互的函数/包?如果我要编写一个循环,我将如何在不查看绘图的情况下检查每个场景的残差的正态性和随机性?(夏普测试不适用于大样本量)。太感谢了!

更新:fit2b <- lm(f$Assets ~ polym(f$C,f$Suc,f$SP,f$SS, f$Qual_P, f$A, f$TotalAA, f$Eq,f$D, f $PE, f$EI, f$GE, f$EO, degree = 5, raw=TRUE) + f$Gender + f$LT)

fit1b = lm(f$Assets ~ f$A)

步骤(fit1b,范围=列表(上=fit2b,下=~1),方向=“前进”,跟踪=假)

另外,我想知道除了 vif 是否还有其他工具可以检测多重共线性,以及我应该如何调整模型来解决它。

4

0 回答 0