r - r 逻辑输出中的不完整因子交互作用值

Question

我正在使用具有 12 个不同水平（月）的因子变量的连续变量构建逻辑回归模型。我对每月的交互效果感兴趣。

glm(formula = PQR.dep ~ multi.month.data * Month, family = binomial, 
data = training)

然而，当我查看输出时，初始因子值（一月）似乎是隐含的。

我如何 1) 明确显示该因子的值，或 2) 确定系数和 Pr(>|z|) 是什么？

Coefficients:
                           Estimate Std. Error z value            Pr(>|z|)    
(Intercept)                -1.32310    0.16057   -8.24 <0.0000000000000002 ***
multi.month.data            -0.08626    0.39769   -0.22                0.83    
Month02Feb                  0.05221    0.22231    0.23                0.81    
Month03Mar                 -0.17425    0.22824   -0.76                0.45    
Month04Apr                  0.06336    0.22680    0.28                0.78    
.
.
.  
Month12Dec                   0.05221    0.22231    0.23                0.81
multi.month.data:Month02Feb  0.49568    0.51903    0.96                0.34    
multi.month.data:Month03Mar  0.44301    0.57446    0.77                0.44    
multi.month.data:Month04Apr  0.88472    0.60063    1.47                0.14    
.
.
.  
multi.month.data:Month12Dec  0.88472    0.60063    1.47                0.14

在上面的示例中，如何确定 Month01Jan 和 multi.month.data:Month01Jan 的值？

score 1 · Accepted Answer

当您有一个因子时，R 假设其中一个级别（在本例Month01Jan中为）的系数和 Pr(>|z|) 为 0。您在输出中看到的内容可以被认为是给定月份的影响相比Month01Jan。同样，该月的交互项也是 0。

score 0 · Accepted Answer

如果您回到逻辑回归基础知识，则可以仅使用截距和最低类别中受试者的比例来构建基线水平（月份 = 1 月）的概率估计值，但使用 R，它更容易使用该predict功能。

mod1 <- glm(formula = PQR.dep ~ multi.month.data * Month, 
                  family = binomial, data = training)
predict(mod1, 
       newdata=data.frame(Month=`01Jan`, 
                        multi.month.data = with(training,
                                         seq(min(multi.month.data), 
                                             max(multi.month.data),
                                             length=10))
         type="response" )

（我正在对您对基线“月”级别的价值进行有根据的猜测，）

r - r 逻辑输出中的不完整因子交互作用值

2 回答 2

Related

Reference