首先,非常感谢您的关注和时间。我的问题(使用 R):为了预测 yvar,我运行了一个套索回归,将 xvariables 的集合从 736 减少到 30。
lasso.mod =glmnet(x,y,alpha=1)
cv.out =cv.glmnet (x,y,alpha=1)
lasso.bestlam =cv.out$lambda.min
tmp_coef = coef(cv.out,s=lasso.bestlam)
varnames = data.frame(name = tmp_coef@Dimnames[[1]][tmp_coef@i])
mylist = list(name = tmp_coef@Dimnames[[1]][tmp_coef@i])
因此,我将剩余的变量名称作为数据框和列表。如何创建一个包含剩余 30 个变量及其观察结果的新数据框?换句话说:如何获得不包含 737 个变量但仅包含 31 个变量的原始数据子集?
我认为这应该很容易,但是我已经花了两个多小时,但它从来没有奏效......
最好的祝愿,托马斯