我在数据框中有 57 个特征(列)~4600 行数据集。为了计算一个好的岭回归参数,我想对其进行 10 倍交叉验证。有人可以告诉我如何在 R 中做到这一点吗?
问问题
3033 次
1 回答
6
ridge.cv()
包装中parcor
的目的只是为了达到目的。
这是从手册中摘录的示例:
> n<-100 # number of observations
> p<-60 # number of variables
> X<-matrix(rnorm(n*p),ncol=p)
> y<-rnorm(n)
> ridge.object<-ridge.cv(X,y)
> ridge.object
$intercept
0.01146743
$coefficients
X1 X2 X3 X4 X5 X6 X7
1.709387e-02 4.833916e-03 3.954463e-03 -9.671448e-03 4.507962e-03 -6.370366e-03 -4.655737e-02
...
X57 X58 X59 X60
-2.119606e-03 -1.229390e-04 -1.912877e-03 -1.833788e-02
$lambda.opt
[1] 540
这里,$lambda.opt
是使用十倍交叉验证获得的正则化参数的最佳值。
于 2013-03-06T14:04:34.463 回答