我的问题是:在sklearn
中,如何计算cv_values_
给出的RidgeCV
?为什么它与输出不同metrics.mean_squared_error
?
例如,
X = [1,2,3,4,5,6,7,8,9,10]
X = np.array(X).reshape(-1,1)
y = np.array([1,3.5,4,4.9,6.1,7.2,8.1,8.9,10,11.1])
ax.plot(X, y, 'o')
ax.plot(X, X+1, '-') # help visualize
假设我们在 X 和 y 上训练 Ridge 模型
from sklearn.linear_model import RidgeCV
from sklearn.metrics import mean_squared_error
model = RidgeCV(alphas = [0.001], store_cv_values=True).fit(X, y)
现在的输出
mean_squared_error(y_true=y, y_pred=model.predict(X))
是0.1204000013110009
,而输出
model.cv_values_.mean()
是0.24472577167818438
。
为什么会有如此巨大的差异?我错过了一些明显的东西吗?