1

我想为一个简单的连续四场比赛建立一个 AI 对手。但是,我不只是想创造一个完美的球员,这对人类来说是相当无聊的。相反,我希望拥有一个几乎从零开始并随着时间的推移学习游戏的 AI。

我知道的唯一方法是人工神经网络。然而,似乎这些通常需要监督学习。此外,例如,该文件指出,人工智能只有在大约 20k 场比赛后才接近成为完美玩家——对于人类来说,这有点太多了。

因此我想知道:是否有可能在一个简单的游戏中合理地使用学习型 AI?是否有任何合适的替代方案或扩展神经元网络来完成这项工作?

4

2 回答 2

5

我不知道有什么算法或技术可以让计算机在与人类相同的时间尺度上学习游戏。但是当我们谈论时间尺度时,我们必须小心。

例如,Fogel 和 Chellapilla 开发了一种技术,它使一堆随机生成的神经网络相互对抗,然后使用遗传算法根据结果创建新的更好的神经网络。这最初是用跳棋完成的,但适用于许多游戏。该技术至少消除了人类训练的负担——网络正在与自己对抗。

但它的学习速度有多快?Fogel 和 Chellapilla 在大约 250 代的跳棋上取得了良好的成绩(A 级表现,略低于专家级)......但每一代的比赛都包括大约 150 场不同的比赛,总共约 37,000 场比赛。如果你每天玩一个游戏,你需要 100 年才能玩这么多。也许达到那个水平的人十年来每天都打十场比赛,但这似乎……不太可能。所以从这个意义上说,比人类慢。另一方面,一台好的笔记本电脑可能在一周内可以玩那么多游戏,这是人类无法做到的。

因此,如果您正在寻找一种训练程序,人类将能够在合理的范围内进行训练并感知性能提升......我不知道今天可以做到这一点。(这是有道理的——我们最好的超级计算机仍然没有人脑的原始处理能力,而且我们还没有设计用来利用这种能力的算法。)

但是,如果你只是在寻找一个不完美的人工智能,你可以尝试像 Fogel 和 Chellapilla 的技术,而不是获得最终的、近乎专家级的结果,而只是从运行的中途获取一些东西,或者从最后一刻获取一些东西一代但不是最好的结果。

于 2012-05-19T18:40:33.780 回答
0

您可能想研究名为“General Game Playing”的领域。那里的重点是学习玩计算机以前从未见过的游戏。该算法以明确定义的格式传递游戏规则,并且必须从头开始学习。

最先进的技术几乎总是包含某种蒙特卡洛模拟,其中系统在模拟中与自己进行数千场比赛,同时与人类或其他正在测量的程序进行“真实”比赛。

于 2012-05-20T10:49:30.673 回答