我正在使用 GridseachCV 来调整超参数。我分别有火车,验证数据。我正在遵循预定义的拆分方法来处理这个问题(类似于这个):
ps = PredefinedSplit(test_fold=your_test_fold)
然后cv=ps
设置GridSearchCV
如果我将 refit 参数设置为 true,那么在所有参数调整之后,我的模型将在整个数据上进行训练还是仅在训练数据上进行训练?
我正在使用 GridseachCV 来调整超参数。我分别有火车,验证数据。我正在遵循预定义的拆分方法来处理这个问题(类似于这个):
ps = PredefinedSplit(test_fold=your_test_fold)
然后cv=ps
设置GridSearchCV
如果我将 refit 参数设置为 true,那么在所有参数调整之后,我的模型将在整个数据上进行训练还是仅在训练数据上进行训练?
从文档中:
refit : boolean, string, or callable, default=True
使用整个数据集上找到的最佳参数重新拟合估计器。
因此,是的,它将使用具有最佳超参数的整个数据集。无论您使用默认(3 折 CV)还是来自 PredefinedSplit
.