10

我知道平滑参数(lambda)对于拟合平滑样条曲线非常重要,但是我在这里没有看到任何关于如何选择合理的 lambda(spar=?)的帖子,我被告知 spar 通常范围从 0 到 1 . 任何人都可以分享你使用smooth.spline() 的经验吗?谢谢。

    smooth.spline(x, y = NULL, w = NULL, df, spar = NULL,
          cv = FALSE, all.knots = FALSE, nknots = NULL,
          keep.data = TRUE, df.offset = 0, penalty = 1,
          control.spar = list(), tol = 1e-6 * IQR(x))
4

3 回答 3

10

agstudy 提供了一种直观的选择方式spar。我记得我从线性模型类中学到的(但不准确)是使用交叉验证来选择“最佳” spar。这是从 agstudy 借来的一个玩具示例:

x = seq(1:18)
y = c(1:3,5,4,7:3,2*(2:5),rep(10,4))
splineres <- function(spar){
  res <- rep(0, length(x))
  for (i in 1:length(x)){
    mod <- smooth.spline(x[-i], y[-i], spar = spar)
    res[i] <- predict(mod, x[i])$y - y[i]
  }
  return(sum(res^2))
}

spars <- seq(0, 1.5, by = 0.001)
ss <- rep(0, length(spars))
for (i in 1:length(spars)){
  ss[i] <- splineres(spars[i])
}
plot(spars, ss, 'l', xlab = 'spar', ylab = 'Cross Validation Residual Sum of Squares' , main = 'CV RSS vs Spar')
spars[which.min(ss)]
R > spars[which.min(ss)]
[1] 0.381

在此处输入图像描述

代码不是最整洁的,但你很容易理解。此外,如果您cv=T在 中指定smooth.spline

R > xyspline <- smooth.spline(x, y, cv=T)
R > xyspline$spar
[1] 0.3881
于 2013-02-18T06:29:55.977 回答
5

在你的帮助下smooth.spline,有以下几点:

使用的计算 λ(作为 \code{spar} 的函数)是 λ = r * 256^(3*spar - 1)

晶石可以大于 1(但我猜不会太多)。我认为您可以通过绘制不同翼梁的拟合值来更改此参数并以图形方式选择它。例如:

spars <- seq(0.2,2,length.out=10)          ## I will choose between 10 values 
dat <- data.frame(
  spar= as.factor(rep(spars,each=18)),    ## spar to group data(to get different colors)
  x = seq(1:18),                          ## recycling here to repeat x and y 
  y = c(1:3,5,4,7:3,2*(2:5),rep(10,4)))
xyplot(y~x|spar,data =dat, type=c('p'), pch=19,groups=spar,
       panel =function(x,y,groups,...)
       {
          s2  <- smooth.spline(y,spar=spars[panel.number()])
          panel.lines(s2)
          panel.xyplot(x,y,groups,...)
       })

例如,在这里,我得到了 spars = 0.4的最佳结果

在此处输入图像描述

于 2013-02-18T05:34:20.000 回答
3

如果在相同的 x 值处没有重复点,请尝试设置 GCV=TRUE - 广义交叉验证 (GCV) 过程是一种聪明的方法,可以选择一个很好的 stab 来为 lambda(跨度)选择一个好的值。关于 GCV 的一个简洁细节是,它实际上不必费心为每一组遗漏的点进行计算——正如 Simon Wood 的书中所强调的那样。有关这方面的更多详细信息,请查看 Simon Wood 在MGCV上的网页上的注释。

Adrian Bowman 的 (sm) r-package 有一个函数h.select()专门用于选择 lambda 值的繁重工作(尽管我不能 100% 确定它是否与smooth.spline()基本包中的函数兼容。

于 2013-02-18T06:02:11.537 回答