3

我对 Weka 中可用的 10 折交叉验证和传统的 10 折交叉验证之间的区别有点困惑。我理解 K 折交叉验证的概念,但从我读过的 10 折交叉- Weka 中的验证有点不同。

在 Weka FIRST 中,模型建立在所有数据之上。只有这样才能进行 10 折交叉验证。在传统的 10 折交叉验证中,没有预先构建模型,而是构建了 10 个模型:每次迭代一个(如果我错了,请纠正我!)。但如果是这样的话,Weka 在 10 折交叉验证期间到底做了什么?它是否再次为十次迭代中的每一次创建一个模型,或者它是否使用先前组装的模型。谢谢!

4

1 回答 1

3

据我所知,Weka 中的交叉验证(以及其他评估方法)仅用于估计泛化误差。也就是说,(隐式)假设是您希望将学习模型与您未提供给 Weka 的数据(也称为“验证集”)一起使用。因此,您获得的模型是针对整个数据进行训练的。

在交叉验证期间,它训练和评估许多不同的模型(在您的情况下为 10 个),以估计学习模型的泛化程度。您实际上并没有看到这些模型——它们仅在内部使用。显示的模型未评估。

于 2013-08-14T17:51:53.593 回答