machine-learning - 如何使用线性函数逼近选择我的 q 学习的特征

翻译自：https://stackoverflow.com/questions/38562744 2016-07-25T08:18:38.047

112 次

1

我正在使用强化学习开发人工智能。

这是一个玩家应该避免砖块从天上掉下来的游戏。

有20块砖掉在地上。游戏截图，游戏视频链接

我使用带有线性函数的强化学习来实现 AI。

很难选择最佳特征来获得满意的结果。

无论如何，自从我尝试成功以来，它最终获得了最好的成绩。

但这很奇怪。

有一些原因。

它在大约 10 次训练时很快达到收敛。
我只使用了 6 个功能。
通过多次训练，我无法获得更好的分数。（就像我想让我的人工智能像超级玩家一样玩。但看起来不像。）

同时，我尝试使用很多功能。我将特征定义为游戏屏幕尺寸（960 * 640）。

我填充了砖块与玩家相对坐标的那些特征。我希望能取得比上一个更好的结果。我用这个方法训练了 7 个小时，但没有成功。

底线是我应该如何选择功能以使其发挥最佳作用，或者是否有任何不同的方法来解决它？

0 回答 0