0

我的训练数据包含股票价格和 40 个掩码特征。这些被掩盖的特征也出现在我的测试数据中。我想预测测试数据中的价格列。我可以将其作为正常的监督学习问题来解决,而不是将其视为时间序列问题,因为我有足够的自变量来预测测试数据中的目标变量。

更重要的是,我应该如何处理这个问题。

4

2 回答 2

1

另外,我怀疑我拥有的数据是否可以用于时间序列预测。

我附上了振动散点图的屏幕截图。

数据看起来很奇怪(x 轴上的某些值>1 值)。为什么要分散?

我有压缩机的每日振动数据(大约 1500 个样本),想再预测 30 天。我尝试了 ARIMA,但效果不佳。

实际上,有几种方法可以同时预测 n 值:

  1. 使用模型“预测下一个值”:对下一步进行预测,然后使用它并进行新的预测等等。这里的一个优势:1 个模型。缺点:你的错误会增长得非常快,因为你的错误是在每一步都结合在一起的。
  2. 使用 30 个模型预测 30 个值(提前 1 步,提前 2 步)。它更好,但调整可能需要很长时间。正如这里所建议的,https://github.com/facebook/prophet可以帮助你。
  3. 不同的组合。

顺便说一句,有一个很好的答案:https ://stats.stackexchange.com/a/354849/183391

但首先,检查您的数据,必要时进行插值(两种方式),考虑nan(如果有的话)。如我所见,您必须将更多时间花在数据处理上,而不是模型拟合上。

而且,不要忘记,时间序列有时也可以通过线性回归和其他模型来预测!根据情节的形状,它也可以是一个好方法!

于 2019-01-04T07:33:37.137 回答
0

Facebook的FBProphet库可以根据您的需要进行调整。

这是一个基于趋势+季节性+假期+错误的强大库

这也具有自动变化点趋势检测和异常值检测。

于 2019-01-02T11:19:13.473 回答