尝试使用eps
(从 0 到 1 的位移)首先等于 1e-4(就像你在这里一样),然后使用 1e-3。如果模型的结果在您关心的任何方面都没有差异,那就太好了。如果是,您需要非常小心,因为这表明您的答案对假设非常敏感。
在下面的示例中,色散参数 phi 变化很大,但截距和斜率参数变化不大。
如果您确实发现特定数据的参数发生了令人担忧的变化,那么您需要更加仔细地考虑产生零和一的过程,并适当地对该过程进行建模,例如
- 删失数据模型:通过最小/最大检测阈值出现零/一,将零/一值建模为实际上在尾部某处或
- 障碍/零一通货膨胀模型:零和一通过与其余数据分开的过程产生,使用二项式或多项式模型来表征零与(0,1)与一,然后使用Beta回归(0,1) 分量)
关于这些步骤的问题可能更适合CrossValidated而不是 SO。
样本数据
set.seed(101)
library(betareg)
dd <- data.frame(x=rnorm(500))
rbeta2 <- function(n, prob=0.5, d=1) {
rbeta(n, shape1=prob*d, shape2=(1-prob)*d)
}
dd$y <- rbeta2(500,plogis(1+5*dd$x),d=1)
dd$y[dd$y<1e-8] <- 0
试装功能
ss <- function(eps) {
dd <- transform(dd,
y=pmin(1-eps,pmax(eps,y)))
m <- try(betareg(y~x,data=dd))
if (inherits(m,"try-error")) return(rep(NA,3))
return(coef(m))
}
ss(0) ## fails
ss(1e-8) ## fails
ss(1e-4)
## (Intercept) x (phi)
## 0.3140810 1.5724049 0.7604656
ss(1e-3) ## also fails
ss(1e-2)
## (Intercept) x (phi)
## 0.2847142 1.4383922 1.3970437
ss(5e-3)
## (Intercept) x (phi)
## 0.2870852 1.4546247 1.2029984
尝试一系列值
evec <- seq(-4,-1,length=51)
res <- t(sapply(evec, function(e) ss(10^e)) )
library(ggplot2)
ggplot(data.frame(e=10^evec,reshape2::melt(res)),
aes(e,value,colour=Var2))+
geom_line()+scale_x_log10()