0

我有兴趣应用 Jackknife 分析来量化我的由逻辑回归估计的系数的不确定性。我正在使用 glm(family='binomial') 因为我的自变量是 0 - 1 格式。

我的数据集有 76000 个 obs,我使用 7 个自变量加上一个偏移量。这个想法涉及将数据拆分为 5 个随机子集,然后通过从数据集中一次删除一个子集来获得 7 个估计参数。然后我可以估计参数的不确定性。

我了解该程序,但我无法在 R 中执行此操作。

这是我适合的模型:

glm(f_ocur ~ altitud + UTM_X + UTM_Y + j_sin + j_cos + temp_res + pp +
             offset(log(1/off)), data = mydata, family = 'binomial')

有谁知道我怎样才能做到这一点?

4

1 回答 1

1

Jackknifing 逻辑回归模型的效率非常低。但是一个简单的时间密集型方法是这样的:

Formula <- f_ocur~altitud+UTM_X+UTM_Y+j_sin+j_cos+temp_res+pp+offset(log(1/off))
coefs <- sapply(1:nrow(mydata), function(i)
  coef(glm(Formula, data=mydata[-i, ], family='binomial'))
)

这是您的留一法系数估计矩阵。该矩阵的协方差矩阵估计参数估计的协方差矩阵。

glm通过使用的主力函数,可以显着缩短时间glm.fit。您可以通过线性化模型走得更远(使用一步估计,niter在 Newton Raphson 算法中限制为仅一次迭代,使用 Jackknife SE 进行一步估计仍然是稳健的、无偏的、整体......)

于 2012-11-14T17:20:03.433 回答