0

我有一个因变量 (DV),它是一个以 [0,1) 为界的比例。最初我正在考虑使用 beta 回归来模拟这个比例与其他两个因素(区域和季节)之间的关系,但由于数据包括 0,我必须使用 Smithson 和 Verkuilen (2006) 建议的方法来转换 DV这表明了以下变换: (y · (n − 1) + 0.5)/n 其中 n 是样本大小。

这是一个有效的选项,但我开始认为,由于我作为响应建模的比例实际上是加权计数/总数,因此将响应建模为二项式并使用权重的偏移项可能会更好。我的示例中使用的 DV 是 p,其中 p 是 (#observed/total)/# of days,因此在这种情况下,# of days 将是加权因子。

在这种情况下哪种方法最合适?

4

1 回答 1

0

我建议使用 R 中的“零膨胀 Beta 回归”包zoib,它具有处理比例数据中真实 0 和 1 观察值的专门方法。虽然它不像betareg维护者擅长回答问题那样直观。

https://journal.r-project.org/archive/2015/RJ-2015-019/RJ-2015-019.pdf

一个带有因子 Zone 和 Season 的示例,其中所有因子都会影响均值、方差、零概率和 1 概率(在您的数据中可能或可能不合理)将是:

zmod <- zoib(Yprop ~ Zone*Season | Zone*Season | Zone*Season | Zone*Season, data=zone_season_data)
plot(as.numeric(zone_season_data$Zone),
    apply( rbind(zm1$ypred[[1]],zm1$ypred[[2]]), 2,mean),
    ylab = 'Predicted Yprop', xlab = 'Zone',
    ylim = c(0,1), pch = 19, col = 4 )
于 2020-08-12T12:30:50.030 回答