reinforcement-learning - 一步多动作，强化学习

翻译自：https://stackoverflow.com/questions/66651626 2021-03-16T08:38:10.930

284 次

我正在尝试编写一个自定义的 openAI Gym 环境，其中代理在每个步骤中执行 2 个动作，其中一个是离散动作，另一个是连续动作。我正在使用 Ray RLLib 并使用 SAC 算法，因为它同时支持离散和连续动作空间。我的问题是有没有人知道如何让代理每一步采取两个动作，一个是连续的，另一个是离散的？

reinforcement-learning - 一步多动作，强化学习

0 回答 0

Related

Reference