我正在使用两部分或障碍模型来模拟给定一组协变量(障碍部分)和另一组协变量来模拟模型的负二项式部分的飞行概率。
首先,我反复搜索最佳预测变量来解释数据中是否存在零。根据 AIC 标准选择了一个连续预测变量和一个二分预测变量。然后我探索了连续预测变量的分段项的使用。连续协变量中的一个断点显着改善了拟合。
这是分段包的输出
Estimated Break-Point(s):
Est. St.Err
3.849 1.368
t value for the gap-variable(s) V: 0
Meaningful coefficients of the linear terms:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.2744 0.3556 -0.772 0.4403
approach_km -0.4526 0.2184 -2.072 0.0383 *
sea2 0.3627 0.2280 1.591 0.1117
U1.approach_km 0.4549 0.2188 2.079 NA
U1.approach_km 系数的斜率是其系数与 approach_km 系数之间的差,基本上为零。因此,在大于断点的距离处,方法_km 不再预测存在或不存在。
我想出了一种在这些变量中编码的方法,以便将它们添加到障碍模型中,这只是一个基本的 glm 形式,但有两组(可能不同的)coavriates,由 | 分隔。象征。
manual <- glm(occur ~ approach_km + I(pmax(approach_km-3.849,0)) + sea, data=land11, family=binomial)
summary(manual)
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.27441 0.29347 -0.935 0.350
approach_km -0.45261 0.09993 -4.529 5.92e-06 ***
I(pmax(approach_km - 3.849, 0)) 0.45486 0.10723 4.242 2.22e-05 ***
sea2 0.36271 0.22803 1.591 0.112
这导致相同的系数估计值但不同的 Std。错误。它还导致相同的残余偏差(均为 508.36)和相同的 AIC 分数 516.36,尽管自由度不同(分割对象少一个)。
关于如何获得 Std 的任何想法。将这个公式输入障碍包时,错误是否一致或无关紧要