0

在训练我的预测器时,我遇到了这个错误,我被困住了如何修复它。

我有两个数据系列,一个“目标时间序列数据”有 9234 行和一个“item_id”,第二个是“相关时间序列数据”,其行数与我只有一个 id .

我正在使用 180 天的窗口设置数据,错误中出现的第二个和第一个数字之间到底有什么区别,9414 - 9234 = 180。

We were unable to train your predictor.
Please ensure there are no missing values for any items in the related time series, All items need data until 2020-03-15 00:00:00.0. For example, following items have missing data: item: brl only has 9234/9414 required datapoints starting 1994-06-07 00:00:00.0, please refer to documentation for additional details.

一旦我的数据没有丢失数据并且每天都会出现,为什么它会返回此错误?我的数据从 1994-06-07 开始,到 2019-09-17 结束。为什么我应该有 9414 个数据点而不是 9234 个?我应该在“目标时间序列数据”中取出 180 天吗?

4

1 回答 1

2

必须知道相关时间序列数据的未来值。

良好相关时间序列的示例:您知道营销部门已经或将要发送电子邮件时事通讯来宣传您预测的产品的过去和未来的日子。您可以将此数据用作相关时间序列。

不良相关时间序列示例:您注意到 Google 搜索与您的产品销售相关的品牌。因此,您希望将其用作相关时间序列。由于您不知道将来会发生多少次搜索,因此您不能将其用作相关的时间序列。

在您的情况下,您有 9414 天的 TARGET_TIME_SERIES 数据,并且您想预测未来 180 天的需求。这意味着您的 RELATED_TIME_SERIES 数据应该是 9594 天。

Edit: I have not tested this with amazon's forecasting product. I'm basing my answer on working with Facebook Prophet (which is one of the models amazon forcast uses). Please let me know if my solution worked.

于 2019-09-19T14:36:15.843 回答