0

我有 3 个月的时间序列数据,间隔 15 分钟。(一天有 96 个时间段)我有温度栏 [Temp] 和太阳辐照度 [SI](太阳强度)栏。我的模型必须在“前一天”的基础上预测一整天的温度。即我必须根据前一天的数据预测 96 个时隙。当我“自己”评估我的模型并将我的数据分成训练集和测试集时。我如何拆分它们?我会做 80:20 的拆分吗?但是我的测试数据会有超过一天的读数。还是我做一个(3个月 - 1天)->作为火车,只在最后一天测试?

4

1 回答 1

1

实际上,这取决于您的任务。但强烈建议不要在训练集中混合新旧数据。

有几个链接可能对您有用:

http://francescopochetti.com/pythonic-cross-validation-time-series-pandas-scikit-learn/

https://stats.stackexchange.com/questions/117350/how-to-split-dataset-for-time-series-prediction

https://stats.stackexchange.com/questions/346907/splitting-time-series-data-into-train-test-validation-sets

于 2019-02-02T08:38:43.193 回答