python - scikit Lasso/LARS 如何用作回归特征选择工具？

Question

我有大约 22 个数据预测变量 x_i，我想减少到一定数量以便最好地描述 y。基本问题...但是，我很不清楚如何使用 scikit 和 linearmodel.lassoLars 来执行此任务。

从他们的示例文档中，代码类似于：

alpha = 0.1
lasso = Lasso(alpha=alpha)

y_pred_lasso = lasso.fit(X_train, y_train).predict(X_test)

所以它执行回归和套索，但我不确定如何使用 y_pred_lasso 来输出我想要的，即来自 22 个最能描述 y_train 的原始预测变量的变量。

score 2 · Accepted Answer

调用实例后，您可以使用实例的coef_属性访问选定的功能。该属性存储每个特征的权重。Lassofit

>>> lasso = Lasso(alpha=alpha).fit(X_train, y_train)
>>> lasso.coef_ != 0
array([ True,  True,  True, False, False,  True,  True,  True,  True,
        True,  True,  True,  True], dtype=bool)
>>> import numpy as np
>>> np.nonzero(lasso.coef_)
(array([ 0,  1,  2,  5,  6,  7,  8,  9, 10, 11, 12]),)

python - scikit Lasso/LARS 如何用作回归特征选择工具？

1 回答 1

Related

Reference