machine-learning - 为什么我们在 KFold 交叉验证后需要 .fit

Question

如果交叉验证在训练数据上训练我们的模型 k 次，那么为什么我们需要 fit 方法。

当我使用下面的代码

from sklearn.model_selection import cross_val_score
cross_val_score(model, train_s1, target_s1, cv=5 , scoring='neg_mean_absolute_error')

我需要使用 .fit 才能使用 .predict。但为什么？当交叉验证已经在训练数据上训练我的模型时。

score 0 · Accepted Answer

在交叉验证中，您处理折叠（K-Fold），可能像 3、5、10 等，其中数据根据提到的折叠分成不同的部分。CV，然后在每个折叠上执行训练，并根据传递给 CV 的不同特征暴露准确性。现在您对您的数据有了一个概念，并且您还知道哪个功能最适合您的数据处理。在此过程之后，您开始对实时数据进行实际的模型训练和预测（这就是您再次调用 fit 的原因）。

CV 有很多好处，您可以浏览这些好处以获得深入的信息。

machine-learning - 为什么我们在 KFold 交叉验证后需要 .fit

1 回答 1

Related

Reference