我正在尝试使用 stable-baselines3 库制作 PPO 模型。我想使用一个带有 LSTM 层的策略网络。但是,我在图书馆的网站上找不到这种可能性,尽管它存在于https://stable-baselines.readthedocs.io/en/master/modules/policies.html#stable_baselines 的早期版本中。 common.policies.MlpLstmPolicy。
这种可能性是否存在于 stable-baselines3 (非 stable-baselines)中?如果没有,我还有其他可能吗?谢谢。