0

我正在尝试用 sklearn 0.23.2 做一个 GradientBoostingClassifier。我有一个非常不平衡的样本:

Good 0 2219522
Bad 1 23397

在此模型中,没有选项class_weight可以设置为“平衡”。

但是,还有另一个参数min_weight_fraction_leaf:float,可选(默认值 0),可以取 0 到 0.5 之间的值。根据 sklearn 文档,这个参数是

需要在叶节点处的权重总和(所有输入样本的)的最小加权分数。当未提供 sample_weight 时,样本具有相同的权重

但是,我无法找到任何进一步的文档,而且它似乎不等同于class_weight. 我已经通过启动模型完成了测试

gbc = GradientBoostingClassifier(n_estimators-100, learning_rate-0.05, 
                                 random_state-1, min_weight_fraction_leaf-0.5)

但是训练和测试的结果还有很多不足之处

ROC AUC (Train): 0.5
ROC AUC (Test): 0.5

有人知道这个min_weight_fraction_leaf参数是如何工作的,或者可以带来一些启示吗?

4

0 回答 0