1

这个问题很接近,但对于我使用单个数据集且没有相关时间序列的类似问题并不能完全帮助我。

我将 AWS Forecast 与单个时间序列数据集一起使用(没有相关数据,只有主 DS)。它是一个每日数据集,包含 2010-2020 年约 10 年的数据。

我在原始数据集中有 3572 个数据点;我手动填写了缺失的数据,以确保在总共 3739 个数据点的日期范围内没有缺失天数。我在 2020 年砍掉了所有东西来创建一个验证数据集,然后为 180 天的预测配置了预测器。我不断收到以下错误:

Unable to evaluate this dataset because there is missing data in the evaluation window for all items. Ensure that there is complete data for at least one item in the evaluation window starting from 2019-03-07T00:00:00 up to 2020-01-01T00:00.

绝对没有丢失的数据,我已经两次和三次检查了日期范围和数据填充,并且开始日期和结束日期之间的每一天都有一个数据点。我还尝试添加 2020 年 1 月 1 日的数据点(它于 2019 年 12 月 31 日结束),但我继续收到此错误。我不知道它在问我什么,除了我的数学中可能遗漏了一些关于预测地平线和回测窗口偏移的东西?

数据集示例: 在此处输入图像描述

简要模型参数(如果我遗漏了相关内容,可以分享更多):

Total data points in training data: 3479
forecastHorizon = 180
create_predictor_response=forecast.create_predictor(PredictorName=predictorName, 
                                                  ForecastHorizon=forecastHorizon,
                                                  PerformAutoML= True,
                                                  PerformHPO=False,
                                                  EvaluationParameters= {"NumberOfBacktestWindows": 1, 
                                                                         "BackTestWindowOffset": 180}, 
                                                  InputDataConfig= {"DatasetGroupArn": datasetGroupArn},
                                                  FeaturizationConfig= {"ForecastFrequency": 'D'
4

1 回答 1

1

我注意到你没有条目6/24/10(这个美国日期格式是最糟糕的顺便说一句)

当我像这样遗漏几天(假设您以每日频率建模)并让预测自动填充nan值的空白(而不是zero默认值)时,我遇到了类似的问题。我建议你:

  • 预先填写训练数据范围内的每个日期(以及预测窗口,如果使用相关数据)
  • 选择zero作为自动填充缺失值的选项。我认为mean或任何其他浮点值也可以解决这个问题

让我知道这是否有效!我也在使用 Forecast,最好跟踪可能的问题和解决方案

于 2021-01-19T14:45:59.290 回答