当我对 m 个类执行 n 折交叉验证时,在每一折中,训练集和测试集是否平衡?通过平衡,我的意思是询问训练和测试集中每个班级是否(几乎)有相同的样本集。
问问题
2047 次
1 回答
5
如果我正确理解这部分:
我的意思是问训练和测试集中每个班级是否有(几乎)相同的样本集。
...我认为您指的是分层交叉验证:每个折叠的类比例与整个数据集的类比例相同。
是的,在 Weka 中当然可以,但您可能需要查阅文档。这些可能有帮助吗?
http://weka.wikispaces.com/Primer
http://weka.wikispaces.com/Generating+cross-validation+folds+(Java+approach)
http://weka.sourceforge.net/doc/weka/filters/supervised/instance/StratifiedRemoveFolds.html
于 2013-01-31T17:41:21.277 回答