1

基本交叉验证:

from sklearn.model_selection import cross_val_score
from sklearn import datasets

X, y = datasets.load_iris(return_X_y=True)
clf = svm.SVC(kernel='linear', C=1)
scores = cross_val_score(clf, X, y, cv=5)

假设有另一个数据X2y2我想与它连接,Xy我不想参与交叉验证。(在所有 5 折中X2y2应该是训练的一部分)。

是否仍然可以使用cross_val_scorefrom scikit-learn 这样做?

换句话说,在cross_val_score部分数据始终保留在训练集中的情况下,是否可以进行部分交叉验证?

PS: X2实际上是合成的y2补充数据,我想知道它们的存在是否有助于模型更好地执行。因此,为了公平比较,它们不应该成为测试的一部分。

4

0 回答 0