我正在尝试为我的时间序列 LSTM 模型实施留一交叉验证,但考虑到我的数据集,我不确定如何去做。
我的数据集由航班 ID (1-279) 组成,它们具有标记为 R1 - R5 的不同路线。每个航班 ID 的航班数据依次记录,每个新的航班 ID 为一个新航班。下面有一个表格比较容易理解
| 航班 | 时间 | ... | 路线 |
|---|---|---|---|
| 1 | 0 | ... | R1 |
| 1 | 0.2 | ... | R1 |
| 1 | ... | ... | R1 |
| 1 | 100 | ... | R1 |
| 2 | 0 | ... | R5 |
| 2 | 0.2 | ... | R5 |
| 2 | ... | ... | R5 |
| 2 | 100 | ... | R5 |
不同的航班号使用相同的路线,例如航班 8、10、12 等都使用 R5。
实施 LOOCV 的最佳方式是什么?是对所有航班运行 LSTM 并省略每个航班号,还是应该使用它们所走的路线将航班组合在一起?