Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我想使用 RL 算法来训练我的项目。但是我在流目录上找不到,我可以使用多少种算法,并且这些算法有一些解释文档,或者如果我想创建自定义算法,该怎么做?
我假设您已经安装了 rllib 以开始使用 Flow 进行培训。如果您转到agents位于下面的目录,Ray/ray/python/ray/rllib/agents/您可以找到支持的算法,例如 PPO 和 DDPG。
agents
Ray/ray/python/ray/rllib/agents/