2

在使用 AWS Forecast 时,是否有某种方法可以使用“部分未来信息”来扩充我们的模型以改进预测?

到目前为止,我已经从 AWS Forecast 获得了相当可靠的预测,但我怀疑如果我能提供一些关于已知未​​来事件的信息,我可以在一定程度上大幅改进预测。

我对预测和机器学习非常陌生,“部分未来信息”是指:

  • 我试图预测变量 X 的时间序列在未来将如何表现
  • 我正在训练一个模型,其中包含许多不同变量的过去时间序列信息,包括 X
  • 我还想为这些变量的一个子集提供已知的未来时间序列信息,因为 1)它们应该对预测产生重大影响 2)这将使我能够执行“假设”分析

更具体地说:

  • 我试图根据过去的收入、网络流量、广告支出和促销折扣来预测未来的收入
  • 到目前为止,AWS Forecast 一直在为我提供良好的预测(我保留了这么多月来自模型的已知数据,并且它对“未来”的预测与已知数据非常匹配)
  • 但是,我真的很想告诉 AWS Forecast,例如,计划在不久的将来进行的重要广告活动
  • 我也非常希望能够改变一些未来的变量或变量,看看它们如何影响结果(“如果我下个月在广告上花费 $Z 会怎样?”)

目前,我将我们所有过去的收入、网络流量、广告支出和促销折扣信息作为“目标时间序列”以具有 3 列(指标名称、时间戳、指标)的单个 CSV 文件格式提供给 AWS Forecast价值); 大约 15 个不同的度量名称值;以及大约 10,000 行数据(15 个变量的数年价值 = ~ 2 * 365 * 15 = ~ 11,000 行)。每个指标都在相同的时间间隔内提供(例如,所有指标都在 2017 年 10 月 1 日和 2019 年 11 月 25 日之间提供)。

我想提供一些额外的部分数据,突出已知的未来重大事件(广告支出、促销折扣),以进一步改进我们的预测。

例如:

  • 2017-10-01 至 2019-11-25 收入
  • 2017-10-01 至 2019-11-25 的网络流量
  • 2017 年 10 月 1 日至 2019 年 11 月 25 日的广告支出
  • 2017-10-01至2019-11-25促销折扣
  • 加上2019-11-26 至 2020-02-01的计划广告支出

有人可以帮助我了解一些术语和“操作方法”机制吗?

4

1 回答 1

1

通常,要在历史数据中使用变量,您还需要对其未来进行预测。这就像试图预测用电量,然后将历史温度放入数据集中。如果您没有对未来温度的预测,那么这些信息对您改进预测没有任何好处。因为现在我知道“额外一度的温度对用电的影响”,但是¿如果我不知道明天的温度是多少,我该怎么办?

在您的情况下,您有 1 个要预测的指标(收入)和三个支持数据:流量、广告支出、折扣。很高兴您有未来的广告支出,但没有其他两个,您有点不走运(根据前一段)。

但是,您仍然可以在这里做一些事情,但您只需要做出一些假设。我要做的是为未来的所有日期选择一个固定值,并为所有未来的日期设置它。也许合适的值是零折扣(全价商品)和网络流量——我正在弥补——每天 1K。现在您拥有过去和未来的完整数据集。

有了这个设置,您现在可以回答这个问题,尽管有一个警告。你得到的预测现在说...

如果我们不提供折扣并且每天有 1000 人访问该网站,那么考虑到我们计划的广告支出,我们可以期望获得多少收入。

也许您可以通过输入与前一年相同的未来流量值来改善这一点。在这种情况下,您现在可以说...

如果我们不提供折扣并且网站获得与去年这个时候相同的流量,那么考虑到我们计划的广告支出,我们可以期望获得多少收入。

您可以将其应用于诸如“流量上升 10%”之类的变化,或者您可以猜测折扣是多少,或者像以前一样,您可以复制一年前的折扣和流量,然后说...

如果我们像去年一样提供折扣并像去年一样查看网站流量,那么考虑到我们计划的广告支出,我们可以期望获得多少收入。

我怀疑你明白了,所以我会停止所有的变化。当然,这些只是对这些数据的未来预测;然而,“创建预测”折扣或网络流量并不值得复杂和花哨。“与去年相同”是对即将发生的事情的完全有效的“预测”。

于 2020-02-05T23:59:27.140 回答