0

我在数据框中有 57 个特征(列)~4600 行数据集。为了计算一个好的岭回归参数,我想对其进行 10 倍交叉验证。有人可以告诉我如何在 R 中做到这一点吗?

4

1 回答 1

6

ridge.cv()包装中parcor的目的只是为了达到目的。

这是从手册中摘录的示例:

> n<-100 # number of observations
> p<-60 # number of variables
> X<-matrix(rnorm(n*p),ncol=p) 
> y<-rnorm(n)
> ridge.object<-ridge.cv(X,y)
> ridge.object
$intercept

0.01146743 

$coefficients
           X1            X2            X3            X4            X5            X6            X7           
 1.709387e-02  4.833916e-03  3.954463e-03 -9.671448e-03  4.507962e-03 -6.370366e-03 -4.655737e-02  
...
          X57           X58           X59           X60 
-2.119606e-03 -1.229390e-04 -1.912877e-03 -1.833788e-02 

$lambda.opt
[1] 540

这里,$lambda.opt是使用十倍交叉验证获得的正则化参数的最佳值。

于 2013-03-06T14:04:34.463 回答