基于Sklearn 文档:
- 是否可以强制使用
StratifiedKFold
? - 我怎么知道哪个
KFold
已被使用?
用这个:
cross_val_score(estimator, X, y, cv=YOURCHOICE)
例子:
from sklearn import datasets, linear_model
from sklearn.model_selection import cross_val_score
diabetes = datasets.load_diabetes()
from sklearn.model_selection import StratifiedKFold
X = diabetes.data[:150]
y = diabetes.target[:150]
lasso = linear_model.Lasso()
skf = StratifiedKFold(n_splits=2)
results = cross_val_score(lasso, X, y, cv=skf)
在sklearn 文档中写道:
“对于
int
/None
输入,如果估计器是分类器并且y
是二元或多类,StratifiedKFold
则使用。在所有其他情况下,KFold
使用。”...
如果您的模型是分类器,只需使用整数来使用StratifiedKFold
.