我读了很多书,对k-folds有点困惑。我理解它背后的概念,但我不确定如何部署它。
我在数据探索之后看到的通常步骤是train_test_split
,对训练集进行编码和缩放fit_transform
,并在测试哪些算法有效之前拟合测试集。之后他们调整超参数。
因此,如果我现在要使用 k-folds,我是否应该避免使用 train_test_split?我们在哪些地方使用 k 折叠?
谢谢!
我读了很多书,对k-folds有点困惑。我理解它背后的概念,但我不确定如何部署它。
我在数据探索之后看到的通常步骤是train_test_split
,对训练集进行编码和缩放fit_transform
,并在测试哪些算法有效之前拟合测试集。之后他们调整超参数。
因此,如果我现在要使用 k-folds,我是否应该避免使用 train_test_split?我们在哪些地方使用 k 折叠?
谢谢!