假设我在一个稀疏矩阵上有一个训练有素的 glmnet 模型,该模型具有多个预测变量,其中包含不同级别的因子(以及因此不同数量的虚拟预测变量)。
df <- data.frame(y=runif(10), catVar=as.factor(sample(0:5,10,TRUE)))
A <- model.matrix(y ~ catVar,df)
train <- cv.glmnet(A[,c('catVar3', 'catVar4')], df$y)
coef(train, s="lambda.min")
转换虚拟系数/值或整体公式的最佳(最有效)方法是什么,就好像虚拟列不是稀疏格式(只有一列不同因素)?
编辑:我需要将虚拟系数及其斜率/值转换回每个级别具有不同斜率的单个系数。