1

我编写了几个函数来从 lm 对象中检索统计数据(系数和 p 值),以供引导。系数一起作用;p 值失败并出现错误:

Error in boot(data = data, statistic = bs_p, R = 1000) : 
  number of items to replace is not a multiple of replacement length

我现在认为该错误与包含因子变量有关。试图用易于重现的数据重现问题。

    L3 <- LETTERS[1:3]
    data <- data.frame(cbind(x = 20:69, y = 1:50), fac = sample(L3, 50, replace = TRUE))
    bs_p <- function (data, i) {
      d <- data[i,]
      fit <- lm (d$y~d$x*d$fac, data=d)
      return(summary(fit)$coefficients[,4])
    }
    bt <- boot(data=data, statistic=bs_p, R=1000)

在我的初学者眼中,从每个返回的类“数字”值似乎具有完全相同的格式......但我猜不是吗?在运行下一个函数之前,我还清除了返回的 bt bootstrap 对象,但这并没有解决它。我怎样才能最好地检索自举 p 值?感谢您的任何想法。(在 Mac OSX 上运行 R 3.0.1。)

4

1 回答 1

1

我不确定您是否可以p-valueslm模型引导(但为此提供了解决方案)。在您的bsorbs_r函数中,您可以删除d$右侧的 ,fit因为您已经定义了数据 d。这是使用 mtcars 数据的示例:

library(boot)

bs <- function(mtcars, i) {
  d <- mtcars[i,]
  fit <- lm (mpg~drat+wt, data=d)
  return(coef(fit))
}
bt <- boot(data=mtcars, statistic=bs, R=1000)

bt

ORDINARY NONPARAMETRIC BOOTSTRAP


Call:
boot(data = mtcars, statistic = bs, R = 1000)


Bootstrap Statistics :
     original      bias    std. error
t1* 30.290370  0.54284222    7.494441
t2*  1.442491 -0.07260619    1.393801
t3* -4.782890 -0.09804271    1.000838

这是来自 的自举 p 值的 p 值lm

bs_r <- function(mtcars, i) {
  d <- mtcars[i,]
  fit <- lm (mpg~drat+wt, data=d)
  return(summary(fit)$coefficients[,4])
}
bt1 <- boot(data=mtcars, statistic=bs_r, R=1000)

ORDINARY NONPARAMETRIC BOOTSTRAP


Call:
boot(data = mtcars, statistic = bs_r, R = 1000)


Bootstrap Statistics :
        original       bias     std. error
t1* 2.737824e-04 4.020024e-03 0.0253248217
t2* 3.308544e-01 7.108738e-02 0.2960776146
t3* 1.589075e-06 5.405459e-05 0.0005540412 
于 2013-09-15T15:06:15.453 回答