在论文“Flow: Architecture and Benchmarking for Reinforcement Learning in Traffic Control”中,作者表示“SUMO 的疤痕跟踪模型针对 1.0 秒的模拟时间步长进行了校准,并且已知它们在较小时间步长下的行为会产生不自然的行为” . 但是,我不明白为什么它会产生不自然的行为。
我已阅读作者引用的参考资料,“(2016)模拟/基本定义。[在线]。可用:http://sumo.dlr.de/wiki/Simulation/Basic Definition#Defining the Time Step Length”。