我有一个线性回归模型,我的成本函数是平方和误差函数。我已将我的完整数据集拆分为三个数据集:训练、验证和测试。我不确定如何计算训练误差和验证误差(以及两者之间的差异)。
训练误差是使用训练数据集计算的残差平方和吗?
我要问的一个例子:所以如果我在 Python 中这样做,假设我在训练数据集中有 90 个数据点,那么这是训练错误的正确代码吗?
y_predicted = f(X_train, theta) #predicted y-value at point x, where y_train is the actual y-value at x
training_error = 0
for i in range(90):
out = y_predicted[i] - y_train[i]
out = out*out
training_error+=out
training_error = training_error/2
print('The training error for this regression model is:', training_error)