python - 将参与者网络输出缩放到 Keras Rl 中的动作空间边界

Question

我正在尝试从 Keras RL 实现 DDPG 并拥有以下参与者网络。

actor = Sequential()
actor.add(Flatten(input_shape=(1,) + env.observation_space.shape))
actor.add(Dense(16))
actor.add(Activation('relu'))
actor.add(Dense(16))
actor.add(Activation('relu'))
actor.add(Dense(16))
actor.add(Activation('relu'))
actor.add(Dense(nb_actions))
actor.add(Activation('linear'))

但是，对于我的问题，我更愿意将输出缩放到自定义的健身房环境动作空间范围。env.action_space.

https://pemami4911.github.io/blog/2016/08/21/ddpg-rl.html使用他们使用的 tflearn api 显示了这一点

def create_actor_network(self):
        inputs = tflearn.input_data(shape=[None, self.s_dim])
        net = tflearn.fully_connected(inputs, 400)
        net = tflearn.layers.normalization.batch_normalization(net)
        net = tflearn.activations.relu(net)
        net = tflearn.fully_connected(net, 300)
        net = tflearn.layers.normalization.batch_normalization(net)
        net = tflearn.activations.relu(net)
        # Final layer weights are init to Uniform[-3e-3, 3e-3]
        w_init = tflearn.initializations.uniform(minval=-0.003, maxval=0.003)
        out = tflearn.fully_connected(
            net, self.a_dim, activation='tanh', weights_init=w_init)
        # Scale output to -action_bound to action_bound
        scaled_out = tf.multiply(out, self.action_bound)
        return inputs, out, scaled_out

根据我的要求缩放输出层的等效命令是什么？

python - 将参与者网络输出缩放到 Keras Rl 中的动作空间边界

0 回答 0

Related

Reference