我注意到,将 SK-learn 的 LogisticRegression 分类器与以下 one-vs-rest 分类器结合使用时,我的 f 分数略低于单独使用它进行多类分类。
class MyOVRClassifier(sklearn.OneVsRestClassifier):
"""
This OVR classifier will always choose at least one label,
regardless of the probability
"""
def predict(self, X):
probs = self.predict_proba(X)[0]
p_max = max(probs)
return [tuple([self.classes_[i] for i, p in enumerate(probs) if p == p_max ])]
由于逻辑回归分类器的文档说明它使用一对多策略,我想知道哪些因素可以解释性能差异。我的 one-vs-rest LR 分类器似乎比 LR 分类器本身对其中一个类的预测更多。