我有以下模型:
mod.log.diab <- glm(data = data_train, INFEC ~ DIABETES, family = binomial(link = 'logit'))
这给出了以下 OR:
>exp(mod.log.diab$coefficients)
(Intercept) DIABETESno
2.826087 1.469822
这个值大于 1,所以我们可以说这个变量是显着的。但是当我应用 Wald 测试时,我得到以下答案:
>regTermTest(mod.log.diab, "DIABETES")
Wald test for DIABETES
in glm(formula = INFEC ~ DIABETES, family = binomial(link = "logit"),
data = data_train)
F = 2.34702 on 1 and 1560 df: p= 0.12573
pvalue 大于 0.05,所以我们拒绝 H0,测试表明它不显着。
我该如何解释这个,谁有真相或测试?
这个问题还没有结束,因为如果我用更多的解释性变量升级模型:
mod.log.cat <- glm(data = train.cat, INFEC ~ DIABETES + EDAD + HCTO, family = binomial(link = 'logit'))
我得到以下或:
>exp(mod.log.mult$coefficients)
(Intercept) DIABETESno EDAD HCTO
1.3275634 1.0751666 0.9817025 1.0558760
以及以下 Wald 测试输出:
Wald test for EDAD
in glm(formula = INFEC ~ DIABETES + EDAD + HCTO, family = binomial(link = "logit"),
data = train.cat)
F = 18.90695 on 1 and 1558 df: p= 1.4615e-05
Wald test for DIABETES
in glm(formula = INFEC ~ DIABETES + EDAD + HCTO, family = binomial(link = "logit"),
data = train.cat)
F = 0.4122714 on 1 and 1558 df: p= 0.52091
Wald test for HCTO
in glm(formula = INFEC ~ DIABETES + EDAD + HCTO, family = binomial(link = "logit"),
data = train.cat)
F = 41.87676 on 1 and 1558 df: p= 1.2986e-10
这次 DIABETES 不会像在简单模型中那样拒绝 wald 测试。但奇怪的事实是所有奇数比都接近相似,所以它们接近 1。结论是什么?OR 接近 1 时,一些变量很重要而其他变量不重要,怎么可能?
谢谢。