0

H20 在文档中说,对回归 gbms 的特征进行拆分是基于平方误差的减少。

这个平方误差是基于节点残差,即 (resid - mean resid)^2 还是真实响应,即 (response - mean response)?我正在使用伽玛/泊松分布。

在伽马/泊松的情况下,损失是偏差,那么为什么要使用平方误差呢?

4

1 回答 1

0

在 H2O 中,均方误差是根据节点残差计算的。目标是有一个无偏估计,因此要最小化的 SE 计算为:

SE = MSE * N = Var * N = w y y - (w * y)^2/N

其中 y 表示节点残差不响应,w 表示权重,N 表示观察次数。您可以在这本小册子中阅读有关 H2O GBM 树学习的更多信息:https ://docs.h2o.ai/h2o/latest-stable/h2o-docs/booklets/GBMBooklet.pdf在理论和框架一章中。

于 2020-12-01T17:43:20.960 回答