1

我正在使用两部分或障碍模型来模拟给定一组协变量(障碍部分)和另一组协变量来模拟模型的负二项式部分的飞行概率。

首先,我反复搜索最佳预测变量来解释数据中是否存在零。根据 AIC 标准选择了一个连续预测变量和一个二分预测变量。然后我探索了连续预测变量的分段项的使用。连续协变量中的一个断点显着改善了拟合。

这是分段包的输出

Estimated Break-Point(s):
   Est. St.Err 
 3.849  1.368 

t value for the gap-variable(s) V:  0 

Meaningful coefficients of the linear terms:
               Estimate Std. Error z value Pr(>|z|)  
(Intercept)     -0.2744     0.3556  -0.772   0.4403  
approach_km     -0.4526     0.2184  -2.072   0.0383 *
sea2             0.3627     0.2280   1.591   0.1117  
U1.approach_km   0.4549     0.2188   2.079       NA  

U1.approach_km 系数的斜率是其系数与 approach_km 系数之间的差,基本上为零。因此,在大于断点的距离处,方法_km 不再预测存在或不存在。

我想出了一种在这些变量中编码的方法,以便将它们添加到障碍模型中,这只是一个基本的 glm 形式,但有两组(可能不同的)coavriates,由 | 分隔。象征。

manual <- glm(occur ~ approach_km + I(pmax(approach_km-3.849,0)) + sea, data=land11, family=binomial)
summary(manual)

Coefficients:
                                Estimate Std. Error z value Pr(>|z|)    
(Intercept)                     -0.27441    0.29347  -0.935    0.350    
approach_km                     -0.45261    0.09993  -4.529 5.92e-06 ***
I(pmax(approach_km - 3.849, 0))  0.45486    0.10723   4.242 2.22e-05 ***
sea2                             0.36271    0.22803   1.591    0.112    

这导致相同的系数估计值但不同的 Std。错误。它还导致相同的残余偏差(均为 508.36)和相同的 AIC 分数 516.36,尽管自由度不同(分割对象少一个)。

关于如何获得 Std 的任何想法。将这个公式输入障碍包时,错误是否一致或无关紧要

4

0 回答 0