我有一个形式的回归问题:
Y~s(x1)+s(x2)+s(x3)+re
其中 s() 表示平滑函数并且是随机效应。
我知道对于每个 x3 值,测量值并不完全位于 Y 的采样位置,而是随机远离它一个已知距离(dist),以 km 为单位。
因此,我的真实 x3(在 dist 0 处)的确定性越接近 Y 的采样位置,我对 x3 在距离为 0 处的边际效应感兴趣,所以 x3 对 Y 的“真实”边际效应。
我考虑在我的 GAM 中使用权重,基于 1/dist 或其他东西,但我想我会加权所有协变量,还有 x1,x2 的协变量,按 x3 到 Y 的距离。这不是我想要的,因为这可能对 x1 和 x2 给出错误或有偏差的估计?
有什么办法可以做到这一点?
这是朝着正确的方向发展吗?
Y~s(x1)+s(x2)+te(x3,dist)+re
或者:
Y~s(x1)+s(x2)+s(x3)+ti(x3,dist)+re
或者:
pvc()
gamlss 包中的功能可以帮助吗?
所以在预测中我将 dist 设置为 0?但是我如何强制例如 te(x3,dist) 在高 dist 值时变为零?
-我正在寻找 R 中基于mgcv
orbamlss
或的解决方案gamlss
。非常感谢!