-6

测试集和训练集有什么区别?

4

2 回答 2

3

您可能必须通过了解三个不同的概念来理解这个概念,它们是

一种。训练集

湾。验证集

C。测试集

您拥有的任何数据集以及当您想要对其应用任何算法时,您都需要将数据集拆分为上述三个。

一种。训练集通常你给出大约 60% 的原始数据集。这包含一组具有预先分类的目标和预测变量的数据。这是为了拟合参数。

湾。验证集通常需要大约 20% 来验证模型到目前为止的学习。在统计学中,它被称为交叉验证。这里的结果与未使用的预分类数据进行比较。验证数据集提供了对训练数据集上模型拟合的无偏评估。

C。测试集通常约为 20% 在这里我们将我们选择的预测算法应用到我们的测试集上,以查看它的执行情况,以便我们了解算法的性能。使用相同的数据进行训练也是不好的作为测试,因为它不会让我们知道网络的泛化程度以及是否发生过拟合。因此,我们需要保持单独的对。

拆分也可以是 60-20-20 甚至 70-15-15

于 2017-12-20T20:07:12.120 回答
2

区别很简单。

一般来说,您可以将训练集划分为 70% 的数据,将测试集划分为 30%。(80/20 也是可能的)

训练集是用于训练模型(分类、回归)的数据集。在设置了一些通用规则后,您将这些规则应用到您的测试集并检查有多少测试数据被正确预测。我希望这可以帮到你!

于 2017-12-20T20:04:23.997 回答