在 Tensorflow 中,我将输入向量的矩阵 X 输入到 LSTM 网络中。输入矩阵的第一个向量(时间步长 1)是一个单热编码向量,而 X 的后续向量(跟随时间步长)是零向量。现在,我想在时间步 1 将损失的梯度反向传播到输入向量上。
如果我使用以下操作,我会得到输入的梯度,但是对于每个时间步。
gradients_input = sess.run(tf.gradients(loss, X), feed_dict={X:batch_x, Y:batch_y})
知道如何仅计算时间步 1 的梯度吗?