r - 了解逻辑回归 R 的系数

Question

这个问题是关于使用 R 理解逻辑回归输出

这是我的示例数据框：

    Drugpairs             AdverseEvent  Y    N
1   Rebetol + Pegintron       Nausea   29 1006
2   Rebetol + Pegintron      Anaemia   21 1014
3   Rebetol + Pegintron     Vomiting   14 1021
4   Ribavirin + Pegasys       Nausea    5  238
5   Ribavirin + Pegasys      Anaemia   12  231
6   Ribavirin + Pegasys     Vomiting    1  242
7 Ribavirin + Pegintron       Nausea   15  479
8 Ribavirin + Pegintron      Anaemia    7  487
9 Ribavirin + Pegintron     Vomiting    9  485

这基本上描述了特定药物对引起医学不良事件的次数。（Y=是，N=否）。我使用以下命令在 R 中对这些数据进行了逻辑回归：

mod.form="cbind(Y,N) ~ Drugpairs * AdverseEvent"
glmhepa.out=glm(mod.form, family=binomial(logit), data=hepatitis.df)

汇总输出如下（仅显示系数表）

                                                      Estimate Std. Error z value
(Intercept)                                          -3.8771     0.2205 -17.586
DrugpairsRibavirin + Pegasys                          0.9196     0.3691   2.491
DrugpairsRibavirin + Pegintron                       -0.3652     0.4399  -0.830
AdverseEventNausea                                    0.3307     0.2900   1.140
AdverseEventVomiting                                 -0.4123     0.3479  -1.185
DrugpairsRibavirin + Pegasys:AdverseEventNausea      -1.2360     0.6131  -2.016
DrugpairsRibavirin + Pegintron:AdverseEventNausea     0.4480     0.5457   0.821
DrugpairsRibavirin + Pegasys:AdverseEventVomiting    -2.1191     1.1013  -1.924
DrugpairsRibavirin + Pegintron:AdverseEventVomiting   0.6678     0.6157   1.085

我知道系数给出概率赔率。然而，我很好奇，为什么 AdverseEventAnaemea 没有系数，以及为什么药物和不良事件 anaemea 的任何组合都没有系数？（最后4行是药物和不良事件的组合效应）

score 1 · Accepted Answer

离散变量的系数用于效果差异（也称为对比）。基线作为 hte 级别向量排序顺序中因子的最低级别，默认按字母顺序排序。您可以更改排序 ort，这将更改参考点并更改系数。使用第二个模型中的交互项，您几乎永远不会发现查看系数本身很有用。查看选定比较的预测效果会更好。

而且......不要忘记，使用逻辑模型，系数是在 log0odds 尺度上估计的。这将使 predict 的使用更加有用，因为使用predict.glmusingtype= "response"可以报告概率规模的影响。

score 0 · Accepted Answer

详细说明 rawr 的评论，这是一个自由度的问题。例如考虑一个模型

lm(height ~ sex, data = dat)

性别变量是男性和女性水平的一个因素。模型的输出将显示一个截距和一个系数 - 如果男性是基本级别，则仅显示女性系数。这是因为截距捕捉到了男性效应。

显示相同模型的另一种方法是

lm(height ~ 0 + sex, data = dat)

这将给出一个具有男性和女性系数的模型，但没有截距。

r - 了解逻辑回归 R 的系数

2 回答 2

Related

Reference