我收到了一篇关于使用机器学习预测股市的论文的反馈,审稿人问了以下问题:
我希望您对您的方法的样本外性能进行统计测试。因此,在原始措辞中“显着不同”。我同意一些图形在视觉上看起来很棒,但在视觉上,随机噪声似乎包含模式。我相信 Sortino Ratio 是适合测试的统计数据,并且可以使用 bootstrap 进行测试。即,获得 BH 和您的策略的分布,并计算这些分布的重叠。
我的问题是我从来没有对时间序列数据这样做过。我的验证过程使用了一种叫做向前走的策略,我在时间上移动数据 11 次,生成 11 种不同的训练和测试组合,没有重叠。所以,这是我的问题:
1-考虑到审稿人的要求,最好(或更合适)的统计测试是什么?
2-如果我没记错的话,统计测试需要向量作为输入,对吗?我可以生成一个包含 11 个 sortino 比率值(每次步行 1 个)的向量,然后将它们与基线进行比较?还是我应该多次运行我的代码?考虑到审查的排序时间,我担心最后的选择是不可行的。
那么,在这个时间序列场景中统计比较机器学习方法的正确行动是什么?