我刚刚开始研究循环神经网络。我在 Elman 的网络上找到了三个信息来源(Elman 1991)。
根据第一个资源,从隐藏到上下文/从上下文到隐藏层的权重没有更新。
从第二个资源中,它还将这些更新设置为 0,这意味着它不会更新权重。
但是从 Stackoverflow 上的第三个资源中,用户声称“上下文神经元神经元值本身不会随着训练的进行而更新。它们与下一层之间的权重在训练期间会更新。”
我知道上下文神经元在时间 t 保存隐藏神经元的值,并在 t + 1 时将其(与输入神经元一起)馈送到隐藏神经元。但是我们是否必须更新两者之间的权重?