我试图找出 H2O 中用于 Tweedie 分布的平均残差损失函数的确切公式。
或者,一般来说,Tweedie 分布因变量的平均残差是多少?
到目前为止,我找到了这个页面(http://docs.h2o.ai/h2o/latest-stable/h2o-docs/data-science/glm.html#tweedie-models)其中tweedie分布的偏差公式给出为:
但是,在 H2O 代码中,可在此页面第 103 行的 github 上找到(https://github.com/h2oai/h2o-3/blob/master/h2o-core/src/main/java/hex/Distribution.java# L103)公式的指定方式不同(忽略欧米茄,它只是权重,并且缺少求和):
2 * w * (Math.pow(y, 2 - tweediePower) / ((1 - tweediePower) * (2 - tweediePower)) - y * exp(f * (1 - tweediePower)) / (1 - tweediePower) + exp(f * (2 - tweediePower)) / (2 - tweediePower))
方程形式为:
那么,是文档错误还是实施错误?我将不胜感激任何帮助!
谢谢!