0

我正在尝试使用最初来自 excel 的数据在 R 中执行多重回归。我使用 lm() 函数在 R 中执行回归,但是当我使用 Excel 中 Solver 加载项中的回归功能对同一组变量执行相同的回归时,我得到了截然不同的结果 - 非常不同的 R^ 2 值,以及我的自变量的不同系数。有谁知道这个问题的原因?

我将在这里澄清我的步骤:在 excel 中创建我的数据,安排在每行是一个事件,每列是一个变量的位置。将 Excel 文件的副本另存为制表符分隔的文本文件。

frame1<-read.table("Data_file.txt")
x1<-frame1[,2]
x2<-frame1[,3]
x3<-frame1[,4]
x4<-frame1[,5]
x5<-frame1[,6]
x6<-frame1[,7]
x7<-frame1[,8]
x8<-frame1[,9]
y<-frame1[,8]
lm1<-lm(y~x1+x2+x3+x4+x5+x6)
summary(lm1)

我已经as.numeric(x1)在所有 x* 和 y 上运行,以检查 R 是否将每个都作为数字导入,它确实如此(返回 TRUE)。

在 excel 中,我打开求解器插件,选择“回归”,选择 y 和 x 范围,然后查看输出。我已经手动查看了 R 中的向量以确保值相同,并且我尝试对我的 excel 文件中的值进行四舍五入,以确保在将它们保存到文本文件或导入 R 时四舍五入不是问题- 它不能解决它。

任何有见识的人将不胜感激。

编辑:R输出:

Call:
lm(formula = lnAssdFCexpanded ~ UNRATE + Housing + SP500 + Outstanding + 
    CPI + GDP + libor12 + ACR)

Residuals:
      Min        1Q    Median        3Q       Max 
-0.069644 -0.017137  0.004542  0.014124  0.050276 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)   
(Intercept)  5.403e-01  2.096e+00   0.258  0.79798   
x1       3.509e-03  5.179e-02   0.068  0.94635   
x2     -4.282e-03  4.328e-03  -0.989  0.32893   
x3       -4.812e-05  2.515e-04  -0.191  0.84930   
x4  2.788e-04  3.102e-04   0.899  0.37459   
x5         -1.859e-03  7.254e-03  -0.256  0.79917   
x6          4.769e-06  1.206e-04   0.040  0.96866   
x7     -1.619e-01  1.042e-01  -1.554  0.12871   
x8          1.510e-02  5.427e-03   2.783  0.00844 **
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.02888 on 37 degrees of freedom
Multiple R-squared:  0.324, Adjusted R-squared:  0.1778 
F-statistic: 2.217 on 8 and 37 DF,  p-value: 0.04849

Excel输出:

SUMMARY OUTPUT              

Regression Statistics               
Multiple R  0.6585439           
R Square    0.433680069         
Adjusted R Square   0.311232516         
Standard Error  0.026435745         
Observations    46          

ANOVA               
    df  SS  MS  F
Regression  8   0.019801242 0.002475155 3.541761833
Residual    37  0.025857398 0.000698849 
Total   45  0.04565864      

    Coefficients    Standard Error  t Stat  P-value
Intercept   -0.540575382    1.95242173  -0.276874291    0.783417585
X Variable 1    0.00497459  0.047237193 0.105310868 0.916697997
X Variable 2    -0.000348463    0.004154182 -0.083882529    0.933602042
X Variable 3    -0.000140051    0.000229284 -0.610818478    0.545054069
X Variable 4    0.000111365 0.000280844 0.396536602 0.693987066
X Variable 5    -0.002129205    0.006640379 -0.3206451  0.750283376
X Variable 6    5.79194E-05 0.000111833 0.51790939  0.607604647
X Variable 7    -0.16469405 0.093923869 -1.753484509    0.087800642
X Variable 8    0.034494338 0.008515322 4.050855618 0.000250969
4

0 回答 0