x = tf.Placeholder(shape=[1,31,5,1])
def func(x):
operations...
return output
convolutionFunction = func(x)
sess = tf.Session()
gradientConv1 = gradientConv1 + sess.run(tf.gradients(tf.square(reward-convolutionFunction), weightsConv1))
gradientConv1(形状为 [2,2,1,32] 的 numpy 数组) weightsConv1(形状为 [2,2,1,32] 的张量变量)
我收到一个错误,例如“占位符的 dtype 应为浮点数,形状为 [1,31,5,1]”。似乎它告诉我我没有为 sess.run 中的函数提供 feed_dict?请指出我的错误。我区分每个值的方式也是正确的。
奖励是一个标量