0

如果交叉验证在训练数据上训练我们的模型 k 次,那么为什么我们需要 fit 方法。

当我使用下面的代码

from sklearn.model_selection import cross_val_score
cross_val_score(model, train_s1, target_s1, cv=5 , scoring='neg_mean_absolute_error')

我需要使用 .fit 才能使用 .predict。但为什么 ?当交叉验证已经在训练数据上训练我的模型时。

4

1 回答 1

0

在交叉验证中,您处理折叠(K-Fold),可能像 3、5、10 等,其中数据根据提到的折叠分成不同的部分。CV,然后在每个折叠上执行训练,并根据传递给 CV 的不同特征暴露准确性。现在您对您的数据有了一个概念,并且您还知道哪个功能最适合您的数据处理。在此过程之后,您开始对实时数据进行实际的模型训练和预测(这就是您再次调用 fit 的原因)。

CV 有很多好处,您可以浏览这些好处以获得深入的信息。

于 2020-12-22T19:17:59.893 回答