最近遇到了 ARIMA/季节性 ARIMA,我想知道为什么选择 AIC 作为模型适用性的估计器。根据Wikipedia的说法,它评估拟合的优度,同时惩罚非简约模型以防止过度拟合。许多网格搜索函数(如Python或Rauto_arima
中的)将其用作评估指标,并建议具有最低 AIC 的模型作为最佳拟合。
但是,在我的情况下,选择一个简单的模型(具有最低 AIC -> 少量参数)只会产生一个模型,该模型强烈遵循先前的样本内观察结果,并且在测试样本数据上表现非常糟糕。我看不出仅通过选择少量参数如何防止过度拟合......
ARIMA(1,0,1)(0,0,0,53); AIC=-16.7
我是不是误会了什么?有什么办法可以防止这种情况发生?