1

我正在尝试使用DeepLearning4j库在 Java 中实现深度确定性策略梯度算法,但是在有效地实现策略梯度方面遇到了一些麻烦。

在许多张量流实现中,策略梯度是使用以下简单命令计算的

tf.gradients(output, network_params, -action_gradient)

这也可以使用 DeepLearning4J 库以简单的方式完成吗?

4

1 回答 1

0

实施外部错误示例中所示的策略梯度对我来说效果很好

https://github.com/deeplearning4j/dl4j-examples/blob/master/dl4j-examples/src/main/java/org/deeplearning4j/examples/misc/externalerrors/MultiLayerNetworkExternalErrors.java

于 2017-05-29T20:59:30.430 回答