我正在尝试使用DeepLearning4j库在 Java 中实现深度确定性策略梯度算法,但是在有效地实现策略梯度方面遇到了一些麻烦。
在许多张量流实现中,策略梯度是使用以下简单命令计算的
tf.gradients(output, network_params, -action_gradient)
这也可以使用 DeepLearning4J 库以简单的方式完成吗?
我正在尝试使用DeepLearning4j库在 Java 中实现深度确定性策略梯度算法,但是在有效地实现策略梯度方面遇到了一些麻烦。
在许多张量流实现中,策略梯度是使用以下简单命令计算的
tf.gradients(output, network_params, -action_gradient)
这也可以使用 DeepLearning4J 库以简单的方式完成吗?