我在 python 中编写了两个进行序列预测的 LSTM RNN 代码。我有一个简单的序列(比如嘈杂的正弦波),我正在训练我的网络以“预测”正弦波的未来值。我的第一个代码只预测单个下一个值(因此只有 1 个输出神经元),而我编写的第二个代码预测 5 个下一个值(即 5 个输出神经元)。为了提前 5 步获得第一个代码的预测,我需要多次调用预测函数(利用前一个预测的输出)。
这两种情况似乎都运作良好,但我真正想要解决的是这两种网络架构中的哪一种最适合这个问题。文献中几乎没有比较这些输出模型的内容。