在 OpenAI 健身房环境中训练时,我认为环境有时会“停止”。对于连续的许多帧,没有球可见/停止生成。
这是健身房环境中的错误吗?这是游戏 Breakout-v0 的一部分吗?
我还想知道 Breakout-v0 中可能的操作是什么。我想出了什么:
0 - 什么都不做/静止不动?
1 - 什么都不做/静止不动?
2 - 向右施加“力”?
3 - 向左施加“力”?
编辑:对于想知道我在说什么的人:看这个 gif:http: //imgur.com/a/pBLGX 5 和 4 生命之间的过渡需要很多帧......有时休息时间甚至比这更长...