我知道 MAPE 和 WMAPE 作为预测误差指标,它们有一些好处。但差距在哪里?有人说:
对于 MAPE: “体积非常小或为零的组合可能会导致结果出现较大偏差” 对于 WMAPE: “与大权重的组合可能会使结果有利于他们”
我不明白,谁能解释这两个指标的弱点的两个陈述?谢谢。
我知道 MAPE 和 WMAPE 作为预测误差指标,它们有一些好处。但差距在哪里?有人说:
对于 MAPE: “体积非常小或为零的组合可能会导致结果出现较大偏差” 对于 WMAPE: “与大权重的组合可能会使结果有利于他们”
我不明白,谁能解释这两个指标的弱点的两个陈述?谢谢。
对于 MAPE,平均绝对百分比误差 [1],假设我们用A表示实际值,用P表示预测值。您在时间 1 到 n 有一系列数据,然后
MAPE = 100/n * ( Sum of |(A(t) - P(t))/A(t)| ), for t in 1..n
where A(t) is the actual value at time t, P(t) is the predicted value at time t.
由于 A(t) 在分母中,因此只要 A(t) 非常小或接近零,该除法就像一除以零,这会在绝对百分比误差中产生非常大的变化。如此大的变化的组合肯定会导致结果的大偏差。
对于 WMAPE,加权平均绝对百分比误差,
Sum of |(A(t) - P(t))/A(t)| * W(t)
WMPAE = -------------------------------------, for t in 1..n
Sum of W(t)
where W(t) is the weight you associate with the prediction at time t.
由于这是一种加权测量,它没有与 MAPE 相同的问题,例如,由于体积非常小或为零而导致的过度倾斜。
然而,加权因子将表明我们希望对每个预测的主观重要性[2]。
例如,考虑到发布日期,我们可以分配权重,权重越高,我们对最近数据的重视程度就越高。在这种情况下,我们可以观察到,即使 MAE 低于合理的阈值,在分析此特定特征时,系统的性能也可能不足。
这就是对最近数据的青睐如何扭曲结果。
[1] http://en.wikipedia.org/wiki/Mean_absolute_percentage_error
[2] http://ir.ii.uam.es/rue2012/papers/rue2012-cleger-tamayo.pdf
还有另一个错误指标:
WAPE = 100/n * Sum(|(A(t) - P(t)|)/sum(A(t)), for t in 1..n
where A(t) is the actual value at time t, P(t) is the predicted value at time t.
它对大的扭曲不敏感。