0

我有大约 10000 个时间序列。

我想使用 auto.arima 功能http://www.inside-r.org/packages/cran/forecast/docs/auto.arima

我想测试我的 auto.arima 模型对 10000 个时间序列的准确性。我推迟了 20% 的数据点(如果您看到 40 个样本中的样本,我将推迟 8 个),然后让 auto.arima 预测。然后我可以将生成的 8 个值与实际的 8 个值进行比较。
但是有没有一种正式的方法来测试 ARIMA 模型的准确性?我的方法正确吗?

y=auto.arima(x)
plot(forecast(y,h=8))

样本时间序列 1

0.0003748,0.0003929,0.0003653,0.0003557,0.0004463,0.000349,0.0003099,0.0003395,0.0003157,0.0002871,0.0002604,0.0002422,0.0001917,0.0002117,0.0002689

时间序列 2

0.0003977,0.0003481,0.0002413,0.0002069,0.0002127,0.0002108,0.0002003,0.0002174,0.0002098,0.0002069,0.0001955,0.0001926,0.0002108,0.0002146,0.0002079
4

1 回答 1

0

在我看来,您的 Q 是关于比较预测准确性的不同指标,而不是和 的具体auto.arima()使用forecast()。如果是这样,那么可以使用许多指标。有关概述,请参阅

https://en.wikipedia.org/wiki/Forecasting#Forecasting_accuracy

他们每个人都有自己的支持者和反对者。例如,请参阅这篇论文:

http://robjhyndman.com/papers/mase.pdf

无论您使用什么准确度指标,您仍然需要能够证明为什么要保留 20% 的数据进行预测。

但是,如果您对不同的模型形式感兴趣,那么您也有一些选择。例如,正如评论中所建议的,

  1. 使用(或一些等价物)将相同的单变量模型(预先指定)拟合到每个时间序列;arima()
  2. 使用 为每个时间序列拟合(可能)不同的单变量模型auto.arima();或者
  3. 将多元模型拟合到所有时间序列。

如果它是您感兴趣的#3,我会在MARSS这里建议 pkg:

https://cran.r-project.org/web/packages/MARSS/index.html

和用户指南在这里:

https://cran.r-project.org/web/packages/MARSS/vignettes/UserGuide.pdf

于 2015-09-29T22:25:14.670 回答