0

我有一些问题。

  1. randperm 在训练数据和测试中的作用是什么?就像这个例子Multi-Class SVM(one vs all)我还是不明白为什么要使用 randperm?

  2. 如果我有一个像手写字母这样的数据,我可以像我的案例的示例链接那样使用 randperm 吗?

是否有任何资源/论文可以用作此问题的背景?我需要一些帮助,谢谢。

4

1 回答 1

0

我只能回答1。

训练集的重点是开发泛化,然后您使用测试集对其进行测试以测试您的泛化。如果您在不创建新的训练和测试集的情况下调整学习算法并重新训练/重新测试,那么您实际上只是在学习测试集,而不是开发泛化。

如果你的结果在训练和测试数据的混洗中是稳定的,那么你更有可能学会了一个很好的概括。

这被称为重复保持方法 -有关几种方法的简要讨论,请参见http://www.umiacs.umd.edu/~joseph/classes/459M/year2010/Chapter5-testing-4on1.pdf 。正如 alrikai 在评论中建议的那样,这是 stats.stackexchange.com 上讨论的那种材料。例如:https ://stats.stackexchange.com/questions/19048/what-is-the-difference-between-test-set-and-validation-set

于 2013-06-18T20:56:22.987 回答