我正在阅读此链接上的实用表:http: //www.statslab.cam.ac.uk/~rds37/teaching/statistical_modelling/Practical6.pdf
在练习 3 中,为了检验母亲的近视和父亲的近视是否同样显着,我们必须创建一个新变量
mumORdadMyopic <- (dadMyopic == "Yes") | (mumMyopic == "Yes")
然后用变量 dadMyopic、mumORdadMyopic 拟合模型。使用前面的练习作为指导,然后我们将执行
data_1 <- myopic %>% dplyr::select(-compH, -TVHR)
data_2 <- myopic %>% dplyr::select(-compH, -TVHR, -mumMyopic) %>% cbind(mumORdadMyopic))
model_1 <- glm(myopic ~ ., data = data_1, family = binomial)
model_2 <- glm(myopic ~ ., data = data_2, family = binomial)
anova(model_1, model_2, test = "LR")
我的问题是这样的:
为了测试 mumMyopic 和 dadMyopic 是否是同等重要的变量,为什么上述是我们想要执行的?我原以为我们会想要拟合一个没有 mumMyopic 的模型,以及一个没有 dadMyopic 的模型,然后比较模型的性能。
newdata_1 <- myopic %>% dplyr::select(-compH, -TVHR, -dadMyopic)
newdata_2 <- myopic %>% dplyr::select(-compH, -TVHR, -mumMyopic)
newmodel_1 <- glm(myopic ~ ., data = newdata_1, family = binomial)
newmodel_2 <- glm(myopic ~ ., data = newdata_2, family = binomial)
anova(newodel_1, newmodel_2, test = "LR")
如果 newmodel_1 和 newmodel_2 显着不同(在统计意义上),我们可以拒绝 mumMyopia 和 dadMyopia 具有相同预测能力的假设。
有人可以解释为什么我建议的方法没有达到我想要的效果,以及为什么练习的预期方法是正确的吗?
谢谢!