我想对SVC分类器的概率输出进行网格搜索交叉验证。特别是我想最小化负对数可能性。从文档看来,它GridSearchCV调用了predict()它传递的估计器的predict()方法,并且SVC返回类预测的方法不是概率(predict_proba()返回类概率)。
1)我是否需要子类化SVC并给它一个predict()返回概率而不是类的方法来完成我的对数似然交叉验证?我想我需要自己写score_func还是loss_func?
2)对这个负对数可能性进行交叉验证是愚蠢的吗?我正在这样做 b/c 数据集是:a)不平衡 5:1 和 b)根本不可分离,即即使“最差”的观察结果也有 > 50% 的机会进入“好”类。(可能还会在统计问答中发布第二个问题)