如何在稳定的基线中拥有多个动作空间。我的动作空间是离散和盒子的组合。我试过 gym.spaces.Tuple([gym.spaces.Discrete(5), gym.spaces.Box(low=0.001, high=1.0, shape=(1,))]) 和 gym.spaces.Dict 但脚本似乎冻结没有任何错误或警告。我正在使用来自 sb3 的 PPO2
如何在稳定的基线中拥有多个动作空间。我的动作空间是离散和盒子的组合。我试过 gym.spaces.Tuple([gym.spaces.Discrete(5), gym.spaces.Box(low=0.001, high=1.0, shape=(1,))]) 和 gym.spaces.Dict 但脚本似乎冻结没有任何错误或警告。我正在使用来自 sb3 的 PPO2