我正在研究一个跨栏模型,遇到了一个我不太明白的问题。我的理解是,跨栏的整体响应预测是计数预测乘以概率预测。即,整体响应必须小于或等于计数预测。但是,在我的数据中,响应预测高于计数预测,我不知道为什么。
这是玩具模型的类似结果(代码改编自此处):
library("pscl")
data("RecreationDemand", package = "AER")
## model
m <- hurdle(trips ~ quality | ski, data = RecreationDemand, dist = "negbin")
nd <- data.frame(quality = 0:5, ski = "no")
predict(m, newdata = nd, type = "count")
predict(m, newdata = nd, type = "response")
为什么计数高于响应?
添加了与 glm.nb 的比较
另外 - 我的印象是障碍模型的计数部分应该对只有正值的计数模型给出相同的预测。当我尝试这样做时,我会得到完全不同的值。我错过了什么??
library(MASS)
m.nb <- glm.nb(trips ~ quality, data = RecreationDemand[RecreationDemand$trips > 0,])
predict(m, newdata = nd, type = "count") ## hurdle
predict(m.nb, newdata = nd, type = "response") ## positive counts only