1
x = tf.Placeholder(shape=[1,31,5,1])
def func(x):
    operations...
    return output

convolutionFunction = func(x)
sess = tf.Session()
gradientConv1 = gradientConv1 + sess.run(tf.gradients(tf.square(reward-convolutionFunction), weightsConv1))

gradientConv1(形状为 [2,2,1,32] 的 numpy 数组) weightsConv1(形状为 [2,2,1,32] 的张量变量)

我收到一个错误,例如“占位符的 dtype 应为浮点数,形状为 [1,31,5,1]”。似乎它告诉我我没有为 sess.run 中的函数提供 feed_dict?请指出我的错误。我区分每个值的方式也是正确的。

奖励是一个标量

4

1 回答 1

1
gradientConv1 = gradientConv1 + sess.run(tf.gradients(tf.square(reward-convolutionFunction), weightsConv1), feed_dict={x: <valueOfPlaceholder> })

其中 valueOfPlaceholder 是我们希望评估函数的点

感谢 Andrey Akhmetov 指出这一点!

于 2018-10-06T19:38:21.443 回答