21

我有一个二元结果的回归模型。我用 glmnet 拟合了模型并得到了选定的变量及其系数。

由于 glmnet 不计算变量的重要性,我想将确切的输出(选定的变量及其系数)提供给 glm 以获取信息(标准错误等)。

我搜索了 r 文档,看来我可以使用 glm 中的“方法”选项来指定用户定义的函数。但是我没有这样做,有人可以帮助我吗?

4

2 回答 2

40

“要求回归系数或其他估计量的标准误差是一个非常自然的问题。原则上,这种标准误差可以很容易地计算出来,例如使用 bootstrap。

尽管如此,这个包还是故意不提供它们。这样做的原因是标准误差对于诸如由惩罚估计方法产生的强烈偏差估计不是很有意义。惩罚估计是一种通过引入大量偏差来减少估计量方差的过程。因此,每个估计量的偏差是其均方误差的主要组成部分,而其方差可能只占一小部分。

不幸的是,在惩罚回归的大多数应用中,不可能获得足够精确的偏差估计。任何基于 bootstrap 的计算只能对估计的方差进行评估。只有当可靠的无偏估计可用时,才可获得可靠的偏差估计,这在使用惩罚估计的情况下通常不是这种情况。

因此,报告惩罚估计的标准误差只能说明部分情况。它可以给人一种非常精确的错误印象,完全忽略了由偏差引起的不准确性。仅基于对估计方差的评估做出置信度陈述肯定是错误的,例如基于自举的置信区间所做的。”

Jelle Goeman 博士 莱顿大学,R 中惩罚包的作者。

于 2013-07-18T13:44:50.670 回答
1

有 CRAN 包hdi和selectionInference为高维模型提供推理,你可能想看看那些......我还看到人们只是使用 选择的预测器运行 a glm但这glmnet并不考虑考虑到最佳模型本身的选择过程产生的不确定性......

于 2017-04-06T15:10:47.027 回答