我目前正在按小时时间序列(来自 M4 预测竞赛 [1] 的数据集)测试先知包。有趣的是,该数据集不包含有关时间序列的任何时间戳信息(年/月/日/小时),仅包含原始观察结果。由于预言家需要一个具有 ds(日期类型)和 y(时间序列)的数据帧,因此我必须综合生成一个时间戳向量来适应这种情况。以下是代码片段的摘录:
ts <- seq(from = as.POSIXct("2012-05-15 07:00"), length.out = 700, by = "hour")
history <- data.frame(ds = ts, y = time_series_data)
ts_fit <- prophet(history, daily.seasonality = TRUE, weekly.seasonality = TRUE, yearly.seasonality = FALSE)
我的问题是综合生成这样的时间戳是否会影响模型的整体性能?换句话说,如果我将时间戳更改为其他时间戳seq(from = as.POSIXct("2013-05-15 07:00"), length.out = 700, by = "hour")
,这会影响预测准确性吗?
而且,在没有时间戳信息的情况下,这也是处理时间序列的正确方法吗?还是有其他可用的替代方案?(在先知中)
谢谢,卡松。