我一直认为从我读到的交叉验证是这样执行的:
在 k 折交叉验证中,原始样本被随机划分为 k 个子样本。在 k 个子样本中,保留一个子样本作为验证数据用于测试模型,剩余的 k-1 个子样本用作训练数据。然后交叉验证过程重复 k 次(折叠),k 个子样本中的每个子样本仅使用一次作为验证数据。然后可以对来自折叠的 k 个结果进行平均(或以其他方式组合)以产生单个估计
因此建立了 k 个模型,最后一个是这些模型的平均值。在 Weka 指南中写道,每个模型始终使用所有数据集构建。那么 Weka 中的交叉验证是如何工作的呢?模型是根据所有数据构建的吗?“交叉验证”意味着创建了 k 个折叠,然后对每个折叠进行评估,最终输出结果只是折叠的平均结果?