0

我正在使用具有 12 个不同水平(月)的因子变量的连续变量构建逻辑回归模型。我对每月的交互效果感兴趣。

glm(formula = PQR.dep ~ multi.month.data * Month, family = binomial, 
data = training)

然而,当我查看输出时,初始因子值(一月)似乎是隐含的。

我如何 1) 明确显示该因子的值,或 2) 确定系数和 Pr(>|z|) 是什么?

Coefficients:
                           Estimate Std. Error z value            Pr(>|z|)    
(Intercept)                -1.32310    0.16057   -8.24 <0.0000000000000002 ***
multi.month.data            -0.08626    0.39769   -0.22                0.83    
Month02Feb                  0.05221    0.22231    0.23                0.81    
Month03Mar                 -0.17425    0.22824   -0.76                0.45    
Month04Apr                  0.06336    0.22680    0.28                0.78    
.
.
.  
Month12Dec                   0.05221    0.22231    0.23                0.81
multi.month.data:Month02Feb  0.49568    0.51903    0.96                0.34    
multi.month.data:Month03Mar  0.44301    0.57446    0.77                0.44    
multi.month.data:Month04Apr  0.88472    0.60063    1.47                0.14    
.
.
.  
multi.month.data:Month12Dec  0.88472    0.60063    1.47                0.14

在上面的示例中,如何确定 Month01Jan 和 multi.month.data:Month01Jan 的值?

4

2 回答 2

1

当您有一个因子时,R 假设其中一个级别(在本例Month01Jan中为 )的系数和 Pr(>|z|) 为 0。您在输出中看到的内容可以被认为是给定月份的影响相比Month01Jan。同样,该月的交互项也是 0。

于 2013-11-05T15:23:58.497 回答
0

如果您回到逻辑回归基础知识,则可以仅使用截距和最低类别中受试者的比例来构建基线水平(月份 = 1 月)的概率估计值,但使用 R,它更容易使用该predict功能。

mod1 <- glm(formula = PQR.dep ~ multi.month.data * Month, 
                  family = binomial, data = training)
predict(mod1, 
       newdata=data.frame(Month=`01Jan`, 
                        multi.month.data = with(training,
                                         seq(min(multi.month.data), 
                                             max(multi.month.data),
                                             length=10))
         type="response" )

(我正在对您对基线“月”级别的价值进行有根据的猜测,)

于 2013-11-05T16:44:48.680 回答