0

我想使用 RL 算法来训练我的项目。但是我在流目录上找不到,我可以使用多少种算法,并且这些算法有一些解释文档,或者如果我想创建自定义算法,该怎么做?

4

1 回答 1

1

我假设您已经安装了 rllib 以开始使用 Flow 进行培训。如果您转到agents位于下面的目录,Ray/ray/python/ray/rllib/agents/您可以找到支持的算法,例如 PPO 和 DDPG。

于 2019-07-25T02:13:14.297 回答