2

有什么方法可以train()使用数据的自定义训练/测试分区运行?我对回测时间序列数据感兴趣(当传统的重采样/CV/等不合适/泄漏时)。即,如果数据按时间从 1...N 排序,那么我在某个截止值之前重复训练数据以预测截止值之后的数据(直到某个滑动窗口大小)。在利用 caret 的其余部分时,我无法确定如何解决这个问题train()。提前感谢您的任何提示。

4

1 回答 1

4

麦克斯在这里。

您可以在 trainControl(index = list()) 中指定自定义重采样索引,其中列表包含用于训练的训练数据元素。

...但是 train() 将使用其他所有内容作为保留,我认为这不是您想要的。

对于这个功能,我可能有大约 10 个不同的请求。需要对 train() 进行一些修改才能做到这一点,但应该不会太糟糕。

然而,1)我不了解时间序列分析(除了简单的基础知识),所以一些带有一两个测试示例的原型代码会很有帮助;2)直到我完成这本书(大约 4 个月)我不会真的有时间做这件事。

因此,如果您愿意贡献一些技术位并且可以等待几个月(可以根据您希望的主动程度来减少),可以通过一些修改来完成。

如果您想进一步讨论,请给我发送电子邮件至包裹上列出的地址。

于 2012-06-21T00:47:48.843 回答