1

使用数据UKDriverDeaths

尝试使用 Holt-Winters 预测函数 & ggplot()

基本上ggplot以置信区间 (2) 重现 (1) 中的数据。

这是数据:

data('UKDriverDeaths')    
past <- window(UKDriverDeaths, end = c(1982, 12))
hw <- HoltWinters(past)
pred <- predict(hw, n.ahead = 10)
plot(hw, pred, ylim = range(UKDriverDeaths))
lines(UKDriverDeaths)

这是在以下位置创建它的解决方案 (1) ggplot()

library(xts)
ts_pred <- ts(c(hw$fitted[, 1], pred), start = 1970, frequency = 12)
df <- merge(as.xts(ts_pred), as.xts(UKDriverDeaths))
names(df) <- c("predicted", "actual")
ggplot(df, aes(x=as.POSIXct(index(df)))) + 
  geom_line(aes(y=predicted), col='red') + 
  geom_line(aes(y=actual), col='black') + 
  theme_bw() +
  geom_vline(xintercept=as.numeric(as.POSIXct("1982-12-01")), linetype="dashed") + 
  labs(title="Holt-Winters filtering\n", x="Time", y="Observed / Fitted") + 
  theme(plot.title = element_text(size=18, face="bold"))

我正在寻找 holt-winters 预测的置信区间 (2)。

4

1 回答 1

2

通常,您将预测的置信区间称为“预测区间”。如果predict.HoltWinters您使用prediction.interval=T. 所以你可以做

pred <- predict(hw, n.ahead = 10, prediction.interval = TRUE)

现在这将改变返回值的形状。你得到的不是一个简单的向量,而是一个矩阵,所以你需要调整一些其他的转换代码来处理这个问题。尝试

ts_pred <- ts(rbind(cbind(hw$fitted[, 1],upr=NA,lwr=NA), pred), 
    start = 1970, frequency = 12)
df <- merge(as.xts(UKDriverDeaths), as.xts(ts_pred))
names(df)[1:2] <- c("actual", "predicted")

这试图确保所有列在观察值和预测值之间正确排列和标记。

现在我们可以在图中添加两条线

ggplot(df, aes(x=as.POSIXct(index(df)))) + 
  geom_line(aes(y=predicted), col='red') + 
  geom_line(aes(y=actual), col='black') + 
  geom_line(aes(y=upr), col='blue') + 
  geom_line(aes(y=lwr), col='blue') + 
  theme_bw() +
  geom_vline(xintercept=as.numeric(as.POSIXct("1982-12-01")), 
      linetype="dashed") + 
  labs(title="Holt-Winters filtering\n", x="Time", y="Observed / Fitted") + 
  theme(plot.title = element_text(size=18, face="bold"))

霍尔特温特斯 gg2 剧情

于 2014-06-12T18:51:27.703 回答