1

我是数据科学的新手,并试图了解预测与实际的差异评估。

可以说我有实际情况:

27.580
25.950
 0.000 (Sum = 53.53)

我使用 XGboost 的预测值为:

    29.9
    25.4
    15.0 (Sum = 70.3)

仅根据总和进行评估会更好吗?示例添加所有实际值减去所有预测值?差 = 70.3 - 53.53?

还是根据 MSE、MAE、RMSE、MAPE 等预测误差技术来评估差异是否更好?

因为,我读到 MAPE 是最广泛接受的,所以在分母为 0 的情况下如何实现,如我上面的实际情况所示?

有没有更好的方法来评估与实际的偏差,或者这些是唯一合法的方法吗?我的目标是建立更多涉及不同变量的预测模型,这些变量会给我不同的预测值,然后选择与实际值偏差最小的模型。

4

2 回答 2

1

如果您要根据每个点或总和进行评估,取决于您的数据和您的用例。

例如,如果每个点代表一个时间桶,并且每个时间桶的准确性很重要(例如对于生产计划),那么我会说需要对每个桶进行评估。

如果你要衡量总和的准确性,那么你也可以根据总和进行预测。

对于您在 MAPE 上的问题,您在此处提到的问题无法解决。您的数据必须非零才能使 MAPE 有价值。如果您只评估一个时间序列,那么您可以使用 MAE,然后您就不会遇到精度无限/未定义的问题。但是,有很多方法可以衡量准确性,我的经验是,这在很大程度上取决于您的用例和您的数据集,哪一种更可取。请参阅Hyndman 关于间歇性需求准确性的文章,了解有关准确性度量的一些要点。

于 2019-10-28T08:52:03.553 回答
0

每当由于 0 而无法计算时,我都会使用MdAPE(Median Absolute Percentage Error)MAPE

于 2021-11-01T14:16:22.710 回答