0

我读了很多书,对k-folds有点困惑。我理解它背后的概念,但我不确定如何部署它。

我在数据探索之后看到的通常步骤是train_test_split,对训练集进行编码和缩放fit_transform,并在测试哪些算法有效之前拟合测试集。之后他们调整超参数。

因此,如果我现在要使用 k-folds,我是否应该避免使用 train_test_split?我们在哪些地方使用 k 折叠?

谢谢!

4

1 回答 1

1

不会。K-fold 将您的数据拆分为训练测试拆分K时间,以便您训练K不同的模型。

这种方法使您的模型结果更加稳健,因为您K使用数据集的不同部分训练不同的模型,并且您还可以预测数据K时间的不同部分。最后,您可以简单地取模型的平均分数K

于 2020-01-20T15:05:12.373 回答