我的任务是从上面的赛车游戏创建一个简单的 2D 视图。这场比赛的唯一目标是尽可能及时取得最好的成绩。玩家可以驾驶汽车并可以加速或减速。如果玩家离开赛道,则游戏结束。
在这一点上很简单,但游戏也有一个 AI。AI 的目标是根据人类玩家过去的轨迹来学习赛道上的“最佳”轨迹。
我正在考虑一些功能,这些可以用作训练集:
- 作为轨道拓扑的函数的玩家追踪
- 播放器的速度作为轨道位置的函数
当然,其他功能或信息也可能有用。
学习方法可以用来产生有效的轨道。我的目标不是击败人类玩家,而是只到达赛道的尽头。:)