我正在尝试使用glm( family='binomial')
.
这是模型:
model<-glm(f_ocur~altitud+UTM_X+UTM_Y+j_sin+j_cos+temp_res+pp,
offset=(log(1/off)), data=mydata, family='binomial')
mydata
有 76820 个观测值。响应变量 (f_ocur) 为 0-1。
该数据是更大数据集的样本,因此设置偏移量的想法是考虑到此处使用的数据代表要分析的真实数据的样本。
由于某种原因,偏移量不起作用。当我运行这个模型时,我得到了一个结果,但是当我运行相同的模型但没有偏移量时,我得到的结果与以前的模型完全相同。我期待一个不同的结果,但没有区别。
难道我做错了什么?偏移量是否应该与线性预测变量一起使用?像这样:
model <- glm(f_ocur~altitud+UTM_X+UTM_Y+j_sin+j_cos+temp_res+pp+offset(log(1/off)),
data=mydata, family='binomial')
模型准备好后,我想将其与新数据一起使用。新数据将是验证此模型的数据,此数据具有相同的列。我的想法是使用:
validate <- predict(model, newdata=data2, type='response')
我的问题来了,预测函数是否考虑了用于创建模型的偏移量?如果不是,我应该怎么做才能获得新数据的正确概率?