0

当我对 m 个类执行 n 折交叉验证时,在每一折中,训练集和测试集是否平衡?通过平衡,我的意思是询问训练和测试集中每个班级是否(几乎)有相同的样本集。

4

1 回答 1

5

如果我正确理解这部分:

我的意思是问训练和测试集中每个班级是否有(几乎)相同的样本集。

...我认为您指的是分层交叉验证:每个折叠的类比例与整个数据集的类比例相同。

是的,在 Weka 中当然可以,但您可能需要查阅文档。这些可能有帮助吗?

http://weka.wikispaces.com/Primer

http://weka.wikispaces.com/Generating+cross-validation+folds+(Java+approach)

http://weka.sourceforge.net/doc/weka/filters/supervised/instance/StratifiedRemoveFolds.html

于 2013-01-31T17:41:21.277 回答