2

我正在尝试使用 stable-baselines3 库制作 PPO 模型。我想使用一个带有 LSTM 层的策略网络。但是,我在图书馆的网站上找不到这种可能性,尽管它存在于https://stable-baselines.readthedocs.io/en/master/modules/policies.html#stable_baselines 的早期版本中。 common.policies.MlpLstmPolicy

这种可能性是否存在于 stable-baselines3 (非 stable-baselines)中?如果没有,我还有其他可能吗?谢谢。

4

1 回答 1

1

来自迁移文档。

https://stable-baselines3.readthedocs.io/en/master/guide/migration.html

重大变化¶

暂时不支持LSTM 策略 ( MlpLstmPolicy, )(请参阅 PR #53 了解周期性 PPO 实施)CnnLstmPolicy

于 2022-01-24T01:26:34.390 回答