我对有助于最具预测性的主成分的特征感兴趣。我正在使用 pycaret,因此 PCA 类在某种程度上隐藏在存储在环境中的管道中。访问 PCA 类以获取每个原始特征的特征值和贡献的最佳方法是什么?
我想这并不是那么简单,因为 pycaret 在运行 PCA 之前会进行很多转换、插补、归一化。
from pycaret.classification import *
experiment = setup(tmp, target_name, silent=True,
session_id=42,
feature_selection=True,
feature_selection_method='boruta',
pca=True, pca_method='linear',
experiment_name=NAME)
model = create_model('catboost')
plot_model(model, 'feature')
最后一个命令生成具有特征重要性的图。现在,我真正感兴趣的是原始特征空间。为此,我需要访问管道并进行反向转换以获取分量向量。