0

我在 SGDClassifier 中使用逻辑回归来执行 ~10k 类别的多类分类。为了获得预测结果的置信度分数,我使用了 predict_proba 函数。但是对于正确和错误的预测,我得到的预测概率值为 0.00026091,0.00049697,0.00019632。

请提出标准化分数的方法,以便我可以通过过滤概率值来考虑结果

4

1 回答 1

0

如果所有类别的概率值都非常低,则可能意味着您的分类器很难对样本进行分类。您可能想做一些特征工程或尝试其他模型。要标准化这些值,请查看 scikit-learn MinMaxScaler。这会将数据缩放到 0 到 1 之间的数字。但正如我所说,如果所有值的概率都非常低,那么您将不会得到好的分类结果。希望有帮助

于 2020-05-20T09:53:23.800 回答