2

我想了解 Scikit-Learn 的梯度提升回归算法。我遵循了他们的源代码,并且很好地理解了他们基于所选损失函数的树的迭代构造。我想不出答案的是,当我调用. predict()

我跟着那个函数调用到这一行。在这里, scale 保存 learning_rate ,如果未提供,将默认为 0.1。所以,如果我要使用 500 棵树,我不明白他们为什么要将给定样本的 500 个不同标签中的每一个都乘以 0.1。

如果有人可以指导我发表一篇深入解释这一点的已发表论文,我将不胜感激。

4

0 回答 0