我正在使用带有 TPOTRegressor 的 LeaveOutGroupOut CV 策略
from tpot import TPOTRegressor
from sklearn.model_selection import LeaveOneGroupOut
tpot = TPOTRegressor(
config_dict=regressor_config_dict,
generations=100,
population_size=100,
cv=LeaveOneGroupOut(),
verbosity=2,
n_jobs=1)
tpot.fit(XX, yy, groups=groups)
优化后,最好的评分训练管道被存储tpot.fitted_pipeline_
并tpot.fitted_pipeline_.predict(X)
可用。
我的问题是:装配好的管道将接受什么培训?例如
- tpot 是否在将其存储之前使用整个数据集重新调整优化的管道
tpot.fitted_pipeline_
? - 或者这将代表一个训练有素的管道,从最好的得分分裂
此外,有没有办法访问与获胜/优化管道的拆分集相对应的完整训练模型集?