5

在 OpenAI 健身房环境中训练时,我认为环境有时会“停止”。对于连续的许多帧,没有球可见/停止生成。

这是健身房环境中的错误吗?这是游戏 Breakout-v0 的一部分吗?

我还想知道 Breakout-v0 中可能的操作是什么。我想出了什么:

0 - 什么都不做/静止不动?

1 - 什么都不做/静止不动?

2 - 向右施加“力”?

3 - 向左施加“力”?

编辑:对于想知道我在说什么的人:看这个 gif:http: //imgur.com/a/pBLGX 5 和 4 生命之间的过渡需要很多帧......有时休息时间甚至比这更长...

4

1 回答 1

5

它的原因是在生命周期结束后,您的代理需要按下启动按钮才能让游戏重新开始玩。如果它不学会这样做,那么游戏将无法进行,并且看起来像你说的那样暂停。

我相信我脑海中的行动是:

0:无操作 1:开火 2:右 3:左

可能在方向上有所不同

于 2017-07-18T19:24:30.693 回答