reinforcement-learning - 稳定基线 3 模型中基于 LSTM 的策略

翻译自：https://stackoverflow.com/questions/70497991 2021-12-27T16:26:34.040

217 次

2

我正在尝试使用 stable-baselines3 库制作 PPO 模型。我想使用一个带有 LSTM 层的策略网络。但是，我在图书馆的网站上找不到这种可能性，尽管它存在于https://stable-baselines.readthedocs.io/en/master/modules/policies.html#stable_baselines 的早期版本中。 common.policies.MlpLstmPolicy。

这种可能性是否存在于 stable-baselines3 （非 stable-baselines）中？如果没有，我还有其他可能吗？谢谢。

1 回答 1

1

来自迁移文档。

https://stable-baselines3.readthedocs.io/en/master/guide/migration.html

重大变化¶

暂时不支持LSTM 策略 ( MlpLstmPolicy, )（请参阅 PR #53 了解周期性 PPO 实施）CnnLstmPolicy

于 2022-01-24T01:26:34.390 回答