我已经看到应该在训练测试拆分之前还是之后进行特征选择?线程并阅读它。一个人在那里解释得很好。然而,这是必须的吗?我的意思是,如果我将整个数据集用于任何问题或数据,而不将其拆分用于特征选择过程。我总是过拟合吗?
例如,我已经为我的整个数据集尝试了 Boruta。它给了我 23 个功能。但是,我也仅使用我的训练集和测试集尝试了 Boruta。它按顺序产生了 15 个和 11 个特征。
如果我过度拟合,我怎么能理解呢?
我已经看到应该在训练测试拆分之前还是之后进行特征选择?线程并阅读它。一个人在那里解释得很好。然而,这是必须的吗?我的意思是,如果我将整个数据集用于任何问题或数据,而不将其拆分用于特征选择过程。我总是过拟合吗?
例如,我已经为我的整个数据集尝试了 Boruta。它给了我 23 个功能。但是,我也仅使用我的训练集和测试集尝试了 Boruta。它按顺序产生了 15 个和 11 个特征。
如果我过度拟合,我怎么能理解呢?