在使用 AWS Forecast 时,是否有某种方法可以使用“部分未来信息”来扩充我们的模型以改进预测?
到目前为止,我已经从 AWS Forecast 获得了相当可靠的预测,但我怀疑如果我能提供一些关于已知未来事件的信息,我可以在一定程度上大幅改进预测。
我对预测和机器学习非常陌生,“部分未来信息”是指:
- 我试图预测变量 X 的时间序列在未来将如何表现
- 我正在训练一个模型,其中包含许多不同变量的过去时间序列信息,包括 X
- 我还想为这些变量的一个子集提供已知的未来时间序列信息,因为 1)它们应该对预测产生重大影响 2)这将使我能够执行“假设”分析
更具体地说:
- 我试图根据过去的收入、网络流量、广告支出和促销折扣来预测未来的收入
- 到目前为止,AWS Forecast 一直在为我提供良好的预测(我保留了这么多月来自模型的已知数据,并且它对“未来”的预测与已知数据非常匹配)
- 但是,我真的很想告诉 AWS Forecast,例如,计划在不久的将来进行的重要广告活动
- 我也非常希望能够改变一些未来的变量或变量,看看它们如何影响结果(“如果我下个月在广告上花费 $Z 会怎样?”)
目前,我将我们所有过去的收入、网络流量、广告支出和促销折扣信息作为“目标时间序列”以具有 3 列(指标名称、时间戳、指标)的单个 CSV 文件格式提供给 AWS Forecast价值); 大约 15 个不同的度量名称值;以及大约 10,000 行数据(15 个变量的数年价值 = ~ 2 * 365 * 15 = ~ 11,000 行)。每个指标都在相同的时间间隔内提供(例如,所有指标都在 2017 年 10 月 1 日和 2019 年 11 月 25 日之间提供)。
我想提供一些额外的部分数据,突出已知的未来重大事件(广告支出、促销折扣),以进一步改进我们的预测。
例如:
- 2017-10-01 至 2019-11-25 收入
- 2017-10-01 至 2019-11-25 的网络流量
- 2017 年 10 月 1 日至 2019 年 11 月 25 日的广告支出
- 2017-10-01至2019-11-25促销折扣
- 加上2019-11-26 至 2020-02-01的计划广告支出
有人可以帮助我了解一些术语和“操作方法”机制吗?