Sklearn 的TimeSeriesSplit是实现与 kfold 交叉验证等效的时间序列的有用方法。然而,它似乎只支持单步范围而没有多步范围,例如它的数据集[1, 2, 3, 4]
可用于分别创建以下训练集和测试集
[1, 2], [3]
[1, 2, 3], [4]
[1, 2, 3, 4], [5].
无法产生的是具有多步预测范围的东西。多步时间序列分割预测范围看起来像
[1, 2,], [3, 4]
[1, 2, 3], [4, 5]
[1, 2, 3, 4], [5, 6],
例如。
我想知道这是否有充分的理由?我能够实现我自己的 TimeSeriesSplit 版本,这样这不是问题,但是我是预测领域的新手。据我了解,使用这样的程序在统计上是衡量模型准确性的最佳方法。我很奇怪 sklearn 没有提供开箱即用的功能,我想知道是否有原因,如果我忽略了任何原因,说明为什么如上所示的多步预测范围意味着我的方法统计准确性评价应该改变吗?