0

我指的是谷歌的机器学习 DataPrep 课程,在这个讲座中https://developers.google.com/machine-learning/data-prep/construct/sampling-splitting/imbalanced-data关于解决类不平衡问题,提到的技术是首先下采样然后上重。这个讲座讲的是理论,但我找不到它的实际实现。有人可以指导吗?

4

1 回答 1

1

进行加权以校准概率分类器提供的概率,以便 predict_proba 方法的输出可以直接解释为置信水平。

此处提供了两种校准方法的 Python 实现 - https://scikit-learn.org/stable/auto_examples/calibration/plot_calibration.html#sphx-glr-auto-examples-calibration-plot-calibration-py

此处提供有关概率校准的更多详细信息 - https://scikit-learn.org/stable/modules/calibration.html

于 2019-08-06T11:22:13.920 回答