2

如果我的输入是可变长度并且我填充它,例如:

[X, Y, Z, PAD, PAD]

然后我传递给 Tensorflow 的 RNN 单元:

sequence_length=3

在评估 PAD 符号之前停止计算,您将获得一系列输出状态(每个输入一个状态):

outputs = [state1, state2, state3, state4, state5] 

state4 和 state5 都为零:

state1 = [0.123, -0.351 ...]
...
state4 = [0, 0, 0, ...] 
state5 = [0, 0, 0, ...]

如果我不传递 sequence_length 参数而是手动将 state4 和 state5 替换为零向量,我的模型的梯度计算是否正确?

4

0 回答 0