如果我的输入是可变长度并且我填充它,例如:
[X, Y, Z, PAD, PAD]
然后我传递给 Tensorflow 的 RNN 单元:
sequence_length=3
在评估 PAD 符号之前停止计算,您将获得一系列输出状态(每个输入一个状态):
outputs = [state1, state2, state3, state4, state5]
state4 和 state5 都为零:
state1 = [0.123, -0.351 ...]
...
state4 = [0, 0, 0, ...]
state5 = [0, 0, 0, ...]
如果我不传递 sequence_length 参数而是手动将 state4 和 state5 替换为零向量,我的模型的梯度计算是否正确?