12

描述

给定一个包含 10 个序列的数据集 - 一个序列对应于一天的股票价值记录 - 其中每个构成 50 个股票价值的样本记录,从早上或上午 9:05 开始,间隔 5 分钟。但是,有一个额外的记录(第 51 个样本)仅在训练集中可用,它比 50 个样本记录中最后一个记录的样本晚了 2 小时,而不是 5 分钟。需要为测试集预测第 51 个样本,其中还给出了前 50 个样本。

我正在使用循环神经网络来解决将序列分组在一起的问题,每个样本pybrain的标签(或通常称为目标)是下一个时间步的样本- 时间序列预测中的典型公式。yx_ix_(i+1)

例子

A sequence for one day is something like:

    Signal id    Time      value
        1     -  9:05   -   23
        2     -  9:10   -   31
        3     -  9:15   -   24
       ...    -  ...    -   ...
       50     -  13:15  -   15

Below is the 2 hour later label 'target' given for the training set 
and is required to be predicted for the testing set
       51     -  15:15   -   11

问题

现在我的循环神经网络 (RNN) 已经对这 10 个序列进行了训练,如果它遇到另一个序列,我将如何使用RNN来预测2 hours序列中最后一个样本之后的库存值?

请注意,对于每个训练序列,我也有“比最后一个样本库存值晚 2 小时”,但我不确定如何将其纳入训练中,RNN因为它期望样本之间的时间间隔相同。谢谢!

4

1 回答 1

23

我希望我这会帮助你

循环网络结构

在此处输入图像描述


一些提示

选择你的循环网络

更成熟的长短时记忆 (LSTM) 神经网络非常适合此类任务。LSTM 能够检测股票价值“图表”中常见的“形状”和“变化”,并且有很多研究试图证明这种形状确实存在于现实生活中!有关示例,请参阅此链接

准确性

如果您希望网络达到更高的准确性,我建议您还向网络提供上一年的股票值(在完全相同的日期),这样输入的数量就会从 50 翻倍到 100。虽然网络可能在您的数据集上得到很好的优化,它将永远无法预测未来的不可预测行为;)

于 2013-09-09T06:24:35.627 回答