0

我有大约 500 个时间序列数据集,为期 2.5 年,每个系列的粒度为 1 天。这相当于大约 100 万个数据点。我想为每个时间序列以 1 天的粒度预测 2 周。这 500 个时间序列之间可能存在相关性。在确保我拥有每个时间戳的数据之后,我们将这些 (500) 个时间序列提供给 autoML,其中每个时间序列都由“序列标识符”标识。因此,我们对 autoML(预测)的输入是时间戳、系列标识符、特征和目标值。我有 30 个特征,它们是分类和数字的组合。使用这种设置,如果我向 autoML 提供数据,训练需要 20 多个小时,这对我来说并不划算。

请帮我优化这个。

4

1 回答 1

1

AutoML 是一个黑盒子。您几乎无法优化训练时间,因为 AutoML 将在后台进行特征工程,并且会非常努力地不过度拟合您的数据。

您在这里只有两个选择:

  • 使用具有最重要时间序列的较小数据集训练模型(这需要时间,因为 automl 必须努力避免过度拟合您的数据集)。

  • 如果对您有意义,请删除时间序列标识符。这使 autoML 有更多机会不过度拟合数据,并可能更早地得到结果。

请记住,您正在调整黑匣子。您的里程会有所不同。

于 2021-08-25T05:39:16.633 回答