logistic-regression - 带有偏移项的 Beta 回归或逻辑回归？

Question

我有一个因变量 (DV)，它是一个以 [0,1) 为界的比例。最初我正在考虑使用 beta 回归来模拟这个比例与其他两个因素（区域和季节）之间的关系，但由于数据包括 0，我必须使用 Smithson 和 Verkuilen (2006) 建议的方法来转换 DV这表明了以下变换： (y · (n − 1) + 0.5)/n 其中 n 是样本大小。

这是一个有效的选项，但我开始认为，由于我作为响应建模的比例实际上是加权计数/总数，因此将响应建模为二项式并使用权重的偏移项可能会更好。我的示例中使用的 DV 是 p，其中 p 是 (#observed/total)/# of days，因此在这种情况下，# of days 将是加权因子。

在这种情况下哪种方法最合适？

score 0 · Accepted Answer

我建议使用 R 中的“零膨胀 Beta 回归”包zoib，它具有处理比例数据中真实 0 和 1 观察值的专门方法。虽然它不像betareg维护者擅长回答问题那样直观。

https://journal.r-project.org/archive/2015/RJ-2015-019/RJ-2015-019.pdf

一个带有因子 Zone 和 Season 的示例，其中所有因子都会影响均值、方差、零概率和 1 概率（在您的数据中可能或可能不合理）将是：

zmod <- zoib(Yprop ~ Zone*Season | Zone*Season | Zone*Season | Zone*Season, data=zone_season_data)
plot(as.numeric(zone_season_data$Zone),
    apply( rbind(zm1$ypred[[1]],zm1$ypred[[2]]), 2,mean),
    ylab = 'Predicted Yprop', xlab = 'Zone',
    ylim = c(0,1), pch = 19, col = 4 )

logistic-regression - 带有偏移项的 Beta 回归或逻辑回归？

1 回答 1

Related

Reference