我改编了一个 scikit-learn 示例来满足我的需要。
它所做的是根据列的类型对列进行预处理:数值数据被缩放,但其他数据使用 OneHotEncoder 进行转换。
然后,管道通过 ColumnTransformer 连接列,然后馈入 LogisticRegression。
有没有一种简单的方法可以在管道结束之前恢复与 LogisticRegression 的系数相对应的特征名称?
还是手动跟踪功能是最好的主意?我该怎么做呢?我的数据集有几十个特征,经过一次热编码后,线性模型得到了数千个。
我能够像这样获得 OneHotEncoder 的功能:clf.steps[0][1].transformers_[1][1].steps[1][1].get_feature_names()
但是,在将它们与数字特征连接后,我无法将它们与 LogisticRegression: 中的系数匹配clf.steps[1][1].coef_
。