3

我正在使用 R 中预测包中的 auto.arima 来确定傅立叶级数的最佳 K 项。

在我这样做之后,我想计算季节性并将一个季节性变量插入到多元回归模型中。

使用预测包中的数据集,我能够提取傅立叶项的最佳数量:

library(forecast)

##Public dataset from the forecast package
head(gas)

##Choose Optimal Amount of K-Terms
bestfit <- list(aicc=Inf)
for(i in 1:6)
{
  fit <- auto.arima(gas, xreg=fourier(gas, K=i), seasonal=FALSE)
  if(fit$aicc < bestfit$aicc)
    bestfit <- fit
  else break;
  optimal_k_value<-max(i)
  print(i)
}

##Extract Fourier Terms 
seasonality<-data.frame(fourier(gas, K=optimal_k_value))

##Convert Gas TS Data to Dataframe
gas_df <- data.frame(gas, year = trunc(time(gas)), 
                 month = month.abb[cycle(gas)])

##Extract True Seasonality by Taking Sum of Rows
seasonality$total<- rowSums(seasonality)

##Combine Seasonality to Month and Year
final_df<-cbind(gas_df, seasonality$total)

seasonality$total列是否会被“季节性变量”考虑以供以后建模,还是我需要向其添加系数?

4

1 回答 1

1

不,seasonality$total不是季节性变量。要看到这一点,请注意每一列fourier(gas, K = optimal_k_value)只是一个从 -1 到 1 的季节性分量,因此它们只是 sin(...) 和 cos(...) 没有任何系数。显然,不同的季节性成分必须具有不同的系数,因此您不应该只是将它们相加。

旁注1:由于i总是一个数字,使用没有意义max(i),就optimal_k_value <- i足够了。

旁注2:我建议检查

plot(resid(auto.arima(gas, xreg = fourier(gas, K = optimal_k_value), seasonal = FALSE)))

一方面,可能存在低于年度频率的季节性(似乎fourier不允许考虑这一点),尽管您可能会将其单独建模为趋势。此外,将数据拆分为 1970 年之前和之后的数据可能是个好主意。

于 2018-11-08T15:50:25.633 回答