1

我正在使用 R 中的线性代数对 OLS 估计器进行手动计算,而我对 R 的内置回归函数 lm() 得到了不同的答案。谁能告诉我为什么会有差异?R不执行OLS吗?

> x1<-rbind(1,2,3,4,5)
> x2<-rbind(3,65,7,2,1)
> x3<-rbind(34,7,23,2,4)
> x4<-rbind(25,50,70,90,110)
> y<-rbind(1,2,3,4,5)
> X<-as.matrix(cbind(x1,x2,x3,x4))
> Y<-as.matrix(cbind(y))
> 
> beta.hat<-solve(t(X)%*%X)%*%t(X)%*%Y
> r.regression<-lm(Y~0+X)
> 
> beta.hat
              [,1]
[1,]  1.000000e+00
[2,] -2.595146e-15
[3,]  8.174017e-15
[4,] -2.309264e-14
> r.regression

Call:
lm(formula = Y ~ 0 + X)

Coefficients:
        X1          X2          X3          X4  
 1.000e+00   3.331e-18   4.152e-17  -6.783e-17  
4

1 回答 1

0

R 可以正常执行 OLS,问题出在您提供的示例中。这是一个基于@DWin 评论的演示。

set.seed(1234)
x1 <- rnorm(5,mean=3)
x2 <- rnorm(5,mean=1,sd=5)
x3 <- rnorm(5,mean=7,sd=1)
x4 <- rnorm(5,mean=1,sd=2)

X<-as.matrix(cbind(x1,x2,x3,x4))
Y<-as.matrix(cbind(y))

(beta.hat<-solve(t(X)%*%X)%*%t(X)%*%Y)
lm(Y~X+0)

如您所见,系数完全相同,并且您的代码重复了,除了更合适的数据。

PS如果这被归类为离题问题,请随时删除答案。我的意图只是用一些代码来说明这个问题,这不适合评论。

于 2013-12-11T10:42:56.687 回答