我正在使用强化学习开发人工智能。
这是一个玩家应该避免砖块从天上掉下来的游戏。
我使用带有线性函数的强化学习来实现 AI。
很难选择最佳特征来获得满意的结果。
无论如何,自从我尝试成功以来,它最终获得了最好的成绩。
但这很奇怪。
有一些原因。
- 它在大约 10 次训练时很快达到收敛。
- 我只使用了 6 个功能。
- 通过多次训练,我无法获得更好的分数。(就像我想让我的人工智能像超级玩家一样玩。但看起来不像。)
同时,我尝试使用很多功能。我将特征定义为游戏屏幕尺寸(960 * 640)。
我填充了砖块与玩家相对坐标的那些特征。我希望能取得比上一个更好的结果。我用这个方法训练了 7 个小时,但没有成功。
底线是我应该如何选择功能以使其发挥最佳作用,或者是否有任何不同的方法来解决它?