我有一个因变量 (DV),它是一个以 [0,1) 为界的比例。最初我正在考虑使用 beta 回归来模拟这个比例与其他两个因素(区域和季节)之间的关系,但由于数据包括 0,我必须使用 Smithson 和 Verkuilen (2006) 建议的方法来转换 DV这表明了以下变换: (y · (n − 1) + 0.5)/n 其中 n 是样本大小。
这是一个有效的选项,但我开始认为,由于我作为响应建模的比例实际上是加权计数/总数,因此将响应建模为二项式并使用权重的偏移项可能会更好。我的示例中使用的 DV 是 p,其中 p 是 (#observed/total)/# of days,因此在这种情况下,# of days 将是加权因子。
在这种情况下哪种方法最合适?