0

这个问题是关于使用 R 理解逻辑回归输出

这是我的示例数据框:

    Drugpairs             AdverseEvent  Y    N
1   Rebetol + Pegintron       Nausea   29 1006
2   Rebetol + Pegintron      Anaemia   21 1014
3   Rebetol + Pegintron     Vomiting   14 1021
4   Ribavirin + Pegasys       Nausea    5  238
5   Ribavirin + Pegasys      Anaemia   12  231
6   Ribavirin + Pegasys     Vomiting    1  242
7 Ribavirin + Pegintron       Nausea   15  479
8 Ribavirin + Pegintron      Anaemia    7  487
9 Ribavirin + Pegintron     Vomiting    9  485

这基本上描述了特定药物对引起医学不良事件的次数。(Y=是,N=否)。我使用以下命令在 R 中对这些数据进行了逻辑回归:

mod.form="cbind(Y,N) ~ Drugpairs * AdverseEvent"
glmhepa.out=glm(mod.form, family=binomial(logit), data=hepatitis.df)

汇总输出如下(仅显示系数表)

                                                      Estimate Std. Error z value
(Intercept)                                          -3.8771     0.2205 -17.586
DrugpairsRibavirin + Pegasys                          0.9196     0.3691   2.491
DrugpairsRibavirin + Pegintron                       -0.3652     0.4399  -0.830
AdverseEventNausea                                    0.3307     0.2900   1.140
AdverseEventVomiting                                 -0.4123     0.3479  -1.185
DrugpairsRibavirin + Pegasys:AdverseEventNausea      -1.2360     0.6131  -2.016
DrugpairsRibavirin + Pegintron:AdverseEventNausea     0.4480     0.5457   0.821
DrugpairsRibavirin + Pegasys:AdverseEventVomiting    -2.1191     1.1013  -1.924
DrugpairsRibavirin + Pegintron:AdverseEventVomiting   0.6678     0.6157   1.085

我知道系数给出概率赔率。然而,我很好奇,为什么 AdverseEventAnaemea 没有系数,以及为什么药物和不良事件 anaemea 的任何组合都没有系数?(最后4行是药物和不良事件的组合效应)

4

2 回答 2

1

离散变量的系数用于效果差异(也称为对比)。基线作为 hte 级别向量排序顺序中因子的最低级别,默认按字母顺序排序。您可以更改排序 ort,这将更改参考点并更改系数。使用第二个模型中的交互项,您几乎永远不会发现查看系数本身很有用。查看选定比较的预测效果会更好。

而且......不要忘记,使用逻辑模型,系数是在 log0odds 尺度上估计的。这将使 predict 的使用更加有用,因为使用predict.glmusingtype= "response"可以报告概率规模的影响。

于 2014-04-11T02:48:54.253 回答
0

详细说明 rawr 的评论,这是一个自由度的问题。例如考虑一个模型

lm(height ~ sex, data = dat)

性别变量是男性和女性水平的一个因素。模型的输出将显示一个截距和一个系数 - 如果男性是基本级别,则仅显示女性系数。这是因为截距捕捉到了男性效应。

显示相同模型的另一种方法是

lm(height ~ 0 + sex, data = dat)

这将给出一个具有男性和女性系数的模型,但没有截距。

于 2014-04-11T02:04:39.827 回答