0

我将过去 3 年的销售数据存储在 Redshift 中,并且每天都会更新。我想每周开始预测下周(基于任何算法作为开始)。

由于我们每天有 1000 万个数据点,我想直接在 Redshift 中作为查询运行预测并从中生成预测。

理想的方法是什么?

(目前我正在使用 HWES(指数平滑),由于计算能力限制,它正在 Pandas 中的较小数据子集上运行。如果需要,可以灵活地查看任何预测模型,例如 SARIMA、Deep AR)

4

1 回答 1

0

我认为没有办法直接在 Redshift 上运行这些进程。我使用 Redshift 作为一种非常快速的工具,可以将在子集数据上运行的 ML 流程的洞察应用到完整数据集上。我有一个过程来查找到多维质心的距离,其中质心由 ML 预测确定。来自 ML 中分析的 10,000 个点的见解应用于 Redshift 中的数百万行。诀窍是转换数学以将洞察力应用于 SQL。

于 2020-12-24T06:37:39.897 回答