我正在使用 SKlearn 的 Pipeline 模型来提取和构建一个统一的特征,然后将其发送到随机森林分类器,而一些特征提取器可以在以后删除或添加,请考虑以下结构:
model = Pipeline([
('feature_extract',
FeatureUnion([
('feature A', extracorA()),
('feature B', ExtractorB()),
('feature C', FeatureUnion([
('c1', C1Extractor())
('c2', C2Extractor())]))
)]),
('random_forest', RandomForestRegressor(...)))])
我想通过检查来改进随机森林的预测
feature_importances_
RandomForstRegressor 的属性
我设法使用以下方法获取列表:
model._final_estimator.feature_importances_
现在我想在 feature_importances_ 索引中的列号与管道中的功能名称/步骤之间动态链接。
是否有首选方法来保存/检索功能联合中的功能名称?你会如何解决这个问题?