我有一个关于 scikit 的新问题要问你。
分类问题,逻辑回归作为估计。我有我的 X 数据集和我的特征。
我想通过交叉验证使用我的算法,我有两种方法:我手动将我的数据集拆分为 5 个子集,最后我迭代 5 次,每次留下不同的集合进行测试。我获得了我的分数,但我现在想要的是与估计器一起使用以在新数据集上进行预测的系数的平均值。我在stackoverflow上的某处读到可以将系数传递给scikit逻辑回归估计器。
另一种方法是使用cross_val_score
:
lrmodel=LogisticRegression(penalty='l2',C=1)
cv.cross_val_score(lrmodel, Xf, y, cv=5,scoring='log_loss', verbose=0)
在交叉验证估计后给我交叉熵。但是,如果现在我想使用平均系数并使用估计器对我的新的未标记数据集进行新的预测怎么办?
谢谢!