2

我想知道如何在 tutorial01 的系统中添加训练有素的 RL 控制车辆。

我已经运行了 tutorial04_rllab。我添加了一个名为“r1”的 RL 控制车辆并成功训练它。现在,当我想在 tutorial01 中做同样的事情时,我不能。看来这辆 RL 控制的车辆表现不佳。

难道是因为我没有添加训练有素的RL控制车辆?

4

1 回答 1

1

当您使用 rllab 训练 RL 策略时,它会生成一组 .pkl 文件,其中包含该策略的内容,例如网络的权重。您可以按照此处的说明可视化此策略:https ://flow.readthedocs.io/en/latest/visualizing.html 。如果您也想在新的模拟中运行它,也可以从 pkl 文件中提取权重/偏差;但是,这不是我们目前支持的东西,您必须使用 Visualizer_rllab 进行一些刺激。我希望这有帮助!如果您有任何其他问题,请告诉我们。

于 2019-06-11T22:19:33.820 回答