考虑如下简单的 GAM 拟合:
library(mgcv)
my.gam <- gam(y~s(x), data=mydata)
- 无论如何要返回估计的平滑参数(lambda)以便我可以保存它?我知道 lambda 在输出中作为“GCV 分数”给出,但我需要一个特定的代码来返回它。
- 如何将 lambda 设置为所需的值?
summary()
不返回平滑参数。您将 GCV 分数与平滑参数混合在一起。如果您不了解这些概念,请咨询当地统计学家,或在 Cross Validated 上提出问题。我只会向您展示如何提取和设置平滑参数。
考虑一个例子:
library(mgcv)
set.seed(2)
dat <- gamSim(1, n=400, dist="normal", scale=2)
b <- gam(y ~ s(x0) + s(x1) + s(x2) + s(x3), data=dat)
您可以从以下位置获取内部平滑参数:
b$sp
# s(x0) s(x1) s(x2) s(x3)
#3.648590e+00 3.850127e+00 1.252710e-02 4.986399e+10
但这些都不是lambda
。它们与lambda
一些正比例因子不同。通常sp
用于平滑参数就足够了。如果要将其设置为固定值,请执行以下操作:
b1 <- gam(y ~ s(x0, sp = 0) + s(x1, sp = 0) + s(x2, sp = 0) + s(x3, sp = 0),
data = dat)
这基本上禁用了对所有平滑项的惩罚。请注意,设置sp
为负值意味着自动选择sp
.
lambda
和sp
:
sapply(b$smooth, "[[", "S.scale") / b$sp
# s(x0) s(x1) s(x2) s(x3)
#6.545005e+00 5.326938e+00 1.490702e+03 4.097379e-10
有时获取lambda
是必要的。当将平滑函数视为随机效应或随机场时,有
variance_parameter_of_random_effect = scale_parameter / lambda
其中尺度参数可以在b$scale
(对于高斯模型这也是b$sig2
)中找到。请参阅相关问题:带有“gp”平滑器的 GAM:如何检索变异函数参数?
跟进
是的,我需要 的确切值
lambda
,所以感谢简洁的代码。然而,我有兴趣了解更多关于比例因子的信息。除了包装手册,我在哪里可以阅读更多关于它的信息?
阅读?smoothCon
:
smoothCon(object,data,knots=NULL,absorb.cons=FALSE,
scale.penalty=TRUE,n=nrow(data),dataX=NULL,
null.space.penalty=FALSE,sparse.cons=0,
diagonal.penalty=FALSE,apply.by=TRUE,modCon=0)
scale.penalty: should the penalty coefficient matrix be scaled to have
approximately the same 'size' as the inner product of the
terms model matrix with itself? ...
的源代码中smoothCon
,有:
if (scale.penalty && length(sm$S) > 0 && is.null(sm$no.rescale)) {
maXX <- norm(sm$X, type = "I")^2
for (i in 1:length(sm$S)) {
maS <- norm(sm$S[[i]])/maXX
sm$S[[i]] <- sm$S[[i]]/maS
sm$S.scale[i] <- maS
}
}
简而言之,对于模型矩阵X
和原始惩罚矩阵S
,比例因子maS
为:
norm(S) / norm(X, type = "I")^2