1

我正在使用强化学习开发人工智能。

这是一个玩家应该避免砖块从天上掉下来的游戏。

有20块砖掉在地上。 游戏截图游戏视频链接

我使用带有线性函数的强化学习来实现 AI。

很难选择最佳特征来获得满意的结果。

无论如何,自从我尝试成功以来,它最终获得了最好的成绩。

但这很奇怪。

有一些原因。

  1. 它在大约 10 次训练时很快达到收敛。
  2. 我只使用了 6 个功能。
  3. 通过多次训练,我无法获得更好的分数。(就像我想让我的人工智能像超级玩家一样玩。但看起来不像。)

同时,我尝试使用很多功能。我将特征定义为游戏屏幕尺寸(960 * 640)。

我填充了砖块与玩家相对坐标的那些特征。我希望能取得比上一个更好的结果。我用这个方法训练了 7 个小时,但没有成功。

底线是我应该如何选择功能以使其发挥最佳作用,或者是否有任何不同的方法来解决它?

4

0 回答 0