我有一个关于交叉验证的问题:我正在使用朴素贝叶斯分类器按作者对博客文章进行分类。当我在没有 k 折交叉验证的情况下验证我的数据集时,我得到 0.6 的准确度分数,但是当我进行 k 折交叉验证时,每个折页都会呈现更高的准确度(大于 0.8)。
例如:
(手动拆分):验证集大小:1452,训练集大小:13063,准确度:0.6033057851239669
进而
(使用 k 折叠):折叠 0 -> 训练集大小:13063,验证集大小:1452 准确度:0.8039702233250621(所有折叠都超过 0.8)
ETC...
为什么会这样?