0

我想用流在 MoSTScenario 中训练一个受控代理,我的问题是我希望 MoSTScenario 的默认配置不被流触及。问题是我想维护 MoSTScenario 中的所有配置(红绿灯功能、不受控制的代理使用的汽车跟随模型等),并且只包括一辆由我控制的车辆,并使用 RLlib 训练。在流程教程中,使用的车辆配置是由流程定义的,而不是相扑中已经存在的,我不知道那里是否有人已经做过类似的事情并且可以帮助我。非常感谢。

4

0 回答 0