我想对SVC
分类器的概率输出进行网格搜索交叉验证。特别是我想最小化负对数可能性。从文档看来,它GridSearchCV
调用了predict()
它传递的估计器的predict()
方法,并且SVC
返回类预测的方法不是概率(predict_proba()
返回类概率)。
1)我是否需要子类化SVC
并给它一个predict()
返回概率而不是类的方法来完成我的对数似然交叉验证?我想我需要自己写score_func
还是loss_func
?
2)对这个负对数可能性进行交叉验证是愚蠢的吗?我正在这样做 b/c 数据集是:a)不平衡 5:1 和 b)根本不可分离,即即使“最差”的观察结果也有 > 50% 的机会进入“好”类。(可能还会在统计问答中发布第二个问题)