我正在尝试使用 RNN 理解序列到序列的学习。到目前为止我所理解的是,编码器的输出用于调节解码器。
然而,我有两个来源,在我看来,它们以不同的方式进行调节,我想知道哪种方式是有效的(可能两者都是)或者我是否错过了什么。
资料来源:Yoav Goldberg 的自然语言处理神经网络方法
据我了解作者,解码器在每一步都使用状态向量和解码器输出以及序列的下一部分进行操作。因此,解码器的状态向量与编码器的结果分离。
资料来源:Francois Chollet 十分钟介绍 Keras 中的序列到序列学习
据我了解作者和来源,解码器提供编码器状态作为初始状态。因此,解码器的状态向量就是解码器的输出。解码器步骤仅取决于通过状态向量的编码器输出。