6

R是否具有加权最小二乘函数?具体来说,我正在寻找计算截距和斜率的东西。

数据集

  1. 1 3 5 7 9 11 14 17 19 25 29
  2. 17 31 19 27 31 62 58 35 29 21 18
  3. 102153 104123 96564 125565 132255 115454 114555 132255 129564 126455 124578

因变量是数据集 3,数据集 1 和 2 是自变量。

4

3 回答 3

12

是的,当然,有一个weights=选项lm(),基本的线性模型拟合函数。快速示例:

R> df <- data.frame(x=1:10)
R> lm(x ~ 1, data=df)            ## i.e. the same as mean(df$x)

Call:
lm(formula = x ~ 1, data = df)

Coefficients:
(Intercept)  
        5.5  

R> lm(x ~ 1, data=df, weights=seq(0.1, 1.0, by=0.1))

Call:
lm(formula = x ~ 1, data = df, weights = seq(0.1, 1, by = 0.1))

Coefficients:
(Intercept)  
          7  

R> 

因此,通过更重地权衡后来的观察,序列 1 到 10 的平均值从 5.5 移动到 7。

于 2011-06-16T16:57:09.347 回答
5

首先,创建数据集。我将它们放入单个 data.frame 中,但这不是绝对必要的。

dat <- data.frame(x1 = c(1,3,5,7,9,11,14,17,19,25, 29)
                  , x2 = c(17, 31, 19, 27, 31, 62, 58, 35, 29, 21, 18)
                  , y  = c(102153, 104123, 96564, 125565, 132255, 115454
                           , 114555, 132255, 129564, 126455, 124578)
                  )

二、估计模型:

> lm(y ~ x1 + x2, data = dat)

Call:
lm(formula = y ~ x1 + x2, data = dat)

Coefficients:
(Intercept)           x1           x2  
  104246.37       906.91        85.76

第三,根据@Dirk 的建议添加您的权重。

第四也是最重要的 - 通读一两个关于 R 回归的教程。谷歌将其列为热门: http: //www.jeremymiles.co.uk/regressionbook/extras/appendix2/R/

于 2011-06-16T17:32:50.383 回答
0

只是另一种看法。您可以先创建一个权重矩阵。例如:

samplevar = var(ydata)

M = diag(40,1/samplevar)

此时 M 是一个 40x40 的对角矩阵。您可以通过将 diag 应用于 M 来转换为向量:

M_vector = diag(M)

然后在lm

   lm ( YXDATAFRAME, weights=M_vector)
于 2014-03-19T17:09:30.877 回答