max_depth
VSmin_samples_leaf
在多次max_depth
尝试min_samples_leaf
使用GridSearchCV
. 据我了解,这两个参数都是控制树木深度的一种方式,如果我错了,请纠正我。
max_features
我正在做一个非常简单的分类任务,更改min_samples_leaf
似乎对 AUC 分数没有影响;但是,调整深度可以将我的 AUC 从 0.79 提高到 0.84,非常显着。似乎没有其他任何影响它。我认为我应该调整的主要内容是max_features
,但是,最佳结果值离sqrt(n_features)
.
scoring='roc_auc'
另一个问题,我注意到如果在更改树的数量时所有参数都固定,GridSearchCV
将始终选择最大数量的树。这是可以理解的,但由于某种原因,AUC 略有下降scoring='roc_auc'
。为什么会这样?它是否考虑 oob_score 。
请随时分享任何有助于理解如何系统地调整随机森林的资源,因为似乎几乎没有相互影响的相关参数。