我试图编写自己的 LSTM(长期短期记忆)神经网络。我想验证基本功能是否正常工作。我已经实现了通过时间反向传播 BPTT 算法来训练单细胞网络。
单细胞 LSTM 网络应该能够学习一个简单的序列,还是需要多个细胞?网络似乎无法学习简单的序列,例如 1 0 0 0 1 0 0 0 1 0 0 0 1。
我按顺序将序列 1 和 0 依次发送到网络中,并将其向前馈送。我记录了序列的每个输出。
在通过 LSTM 单元运行整个序列后,我将平均误差信号反馈回单元,将单元内部的权重变化保存在单独的集合中,并在逐个运行所有错误并计算新权重之后在每个错误之后,我将新权重平均在一起以获得单元格中每个权重的新权重。
难道我做错了什么?我将非常感谢任何建议。
太感谢了!