0

我正在运行一个线性回归模型。我有 33 个连续的解释变量。线性回归的结果是:

ESTF<-lm(log(HousePrice_2$price.yen.m2.)~.,data = HousePrice_2)
Call:
    lm(formula = log(HousePrice_2$V1) ~ E1 + E3 + E4 + E5 + E6 + 
        E7 + E9 + E11 + E12 + E13 + E14 + E15 + E17 + E18 + E19 + 
        E21 + E22 + E23 + E24 + E25 + E26 + E27 + E28 + E29 + E30 + 
        E31 + E34 + E35 + E36 + E37 + E38 + E39 + E45, data = HousePrice_2)

Residuals:
        Min          1Q      Median          3Q         Max 
-0.98457132 -0.20283176 -0.01132873  0.21072971  1.02592116 

Coefficients:
                 Estimate    Std. Error  t value   Pr(>|t|)    
(Intercept)  7.478146e+01  1.158189e+01  6.45676 1.4073e-10 ***
E1          -1.678420e+08  2.282162e+07 -7.35452 3.0192e-13 ***
E3           2.481657e+08  3.196710e+07  7.76316 1.4518e-14 ***
E4           1.048053e+07  1.342064e+06  7.80926 1.0214e-14 ***
E5           1.154938e+07  1.521833e+06  7.58912 5.3834e-14 ***
E6           2.047969e+07  2.895253e+06  7.07354 2.2325e-12 ***
E7           3.129394e+08  4.934785e+07  6.34150 2.9386e-10 ***
E9           2.332690e+06  5.895178e+05  3.95694 7.9170e-05 ***
E11         -2.734790e+07  4.359309e+06 -6.27345 4.5132e-10 ***
E12         -4.761917e+08  7.589544e+07 -6.27431 4.4888e-10 ***
E13         -1.770340e+06  4.659259e+05 -3.79962 0.00015024 ***
E14         -1.210883e+06  2.333111e+05 -5.19000 2.3664e-07 ***
E15         -2.131764e+07  3.831284e+06 -5.56410 3.0746e-08 ***
E17          2.540183e+07  3.647269e+06  6.96462 4.7576e-12 ***
E18          6.851275e+08  9.627961e+07  7.11602 1.6573e-12 ***
E19          2.249070e+08  2.879451e+07  7.81076 1.0097e-14 ***
E21         -1.927894e+07  2.474312e+06 -7.79164 1.1686e-14 ***
E22         -1.602739e+08  2.049514e+07 -7.82009 9.4013e-15 ***
E23          7.541001e+08  9.874725e+07  7.63667 3.7732e-14 ***
E24         -9.934404e+08  1.268787e+08 -7.82984 8.7246e-15 ***
E25         -1.698081e+00  1.034052e+00 -1.64216 0.10074917    
E26          9.775790e+08  1.248296e+08  7.83131 8.6272e-15 ***
E27         -3.644899e+09  4.655646e+08 -7.82899 8.7820e-15 ***
E28          1.247317e+08  1.587659e+07  7.85633 7.1192e-15 ***
E29         -3.710396e+09  4.740074e+08 -7.82772 8.8679e-15 ***
E30          1.053938e+10  1.346325e+09  7.82826 8.8313e-15 ***
E31          9.306411e+09  1.188832e+09  7.82820 8.8354e-15 ***
E34         -5.903855e+08  7.572487e+07 -7.79645 1.1264e-14 ***
E35          3.237143e+08  4.148075e+07  7.80396 1.0636e-14 ***
E36         -2.877417e+06  3.704119e+05 -7.76815 1.3976e-14 ***
E37          1.111132e+08  1.430957e+07  7.76496 1.4320e-14 ***
E38          2.427448e+00  9.945393e-01  2.44078 0.01476142 *  
E39         -1.856438e+07  2.405426e+06 -7.71771 2.0495e-14 ***
E45         -1.006570e+05  1.299734e+04 -7.74443 1.6738e-14 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.3303115 on 1632 degrees of freedom
Multiple R-squared:  0.5202942, Adjusted R-squared:  0.5105943 
F-statistic: 53.63895 on 33 and 1632 DF,  p-value: < 2.2204e-16

可能存在多重共线性,所以我使用了 vif() 和 alias()。然而, vif() 返回了 NAN,而 alias 只返回了模型:

> vif(ESTF)
 E1  E3  E4  E5  E6  E7  E9 E11 E12 E13 E14 E15 E17 E18 E19 E21 E22 E23 E24 E25 E26 E27 E28 E29 E30 E31 E34 E35 
NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN 
E36 E37 E38 E39 E45 
NaN NaN NaN NaN NaN

> alias(ESTF)
Model :
log(HousePrice_2$V1) ~ E1 + E3 + E4 + E5 + E6 + E7 + E9 + E11 + 
    E12 + E13 + E14 + E15 + E17 + E18 + E19 + E21 + E22 + E23 + 
    E24 + E25 + E26 + E27 + E28 + E29 + E30 + E31 + E34 + E35 + 
    E36 + E37 + E38 + E39 + E45

我是 R 新手,谁能解释一下并帮我选择变量?

4

0 回答 0