6

我曾经写过一个玩得很好的俄罗斯方块 AI。我使用的算法(在本文中描述)是一个两步过程。

第一步,程序员决定跟踪对问题“感兴趣”的输入。在俄罗斯方块中,我们可能对跟踪连续有多少间隙感兴趣,因为最小化间隙有助于更容易地放置未来的碎片。另一个可能是平均柱高,因为如果你即将失败,冒险冒险可能是个坏主意。

第二步是确定与每个输入相关的权重。这是我使用遗传算法的部分。只要根据结果随时间调整权重,任何学习算法都可以。这个想法是让计算机决定输入与解决方案的关系。

使用这些输入及其权重,我们可以确定采取任何行动的价值。例如,如果将直线形状一直放在右列将消除 4 个不同行的间隙,那么如果它的权重很高,那么这个动作可以得到很高的分数。同样,将其平放在顶部实际上可能会导致间隙,因此该动作会得到低分。

我一直想知道是否有一种方法可以将学习算法应用于第一步,在那里我们可以找到“有趣”的潜在输入。似乎可以编写一个算法,让计算机首先学习哪些输入可能有用,然后应用学习来衡量这些输入。以前有过这样的事情吗?它是否已经在任何人工智能应用程序中使用?

4

3 回答 3

1

在神经网络中,您可以通过查找与您正在训练的分类具有最强相关性(正或负)的输入来选择“有趣”的潜在输入。我想你可以在其他情况下做类似的事情。

于 2009-10-28T18:04:55.177 回答
0

我想我可能会通过向学习算法提供更多原始数据来解决您所描述的问题。例如,俄罗斯方块游戏状态可以通过占用单元列表来描述。描述此信息的一串位将是学习算法该阶段的合适输入。实际上,这方面的培训仍然具有挑战性;你怎么知道这些是否是有用的结果。我想你可以将整个算法滚动到一个单一的 blob 中,在该算法中输入连续的游戏状态,输出只是块放置,为后代选择更高得分的算法。

另一种选择可能是使用来自其他来源的大量戏剧语料库;例如记录人类玩家的游戏或手工制作的人工智能,并选择输出与未来游戏中的某些有趣事实或其他事物具有强相关性的算法,例如在接下来的 10 步中获得的分数。

于 2009-10-28T18:33:18.010 回答
0

是的,有办法。

如果您选择M个选定的特征,则有 2^M 个子集,所以有很多东西要看。我会做到以下几点:

For each subset S
   run your code to optimize the weights W
   save S and the corresponding W

然后对于每一对SW,你可以为每一对运行G游戏,并为每一对保存分数L。现在你有一个像这样的表:

feature1    feature2    feature3    featureM   subset_code game_number    scoreL
1           0           1           1           S1         1              10500
1           0           1           1           S1         2              6230
...
0           1           1           0           S2         G + 1          30120
0           1           1           0           S2         G + 2          25900

现在您可以运行一些组件选择算法(例如 PCA)并决定哪些特征值得解释 scoreL。

提示:在运行代码以优化 W 时,为随机数生成器播种,以便每个不同的“进化大脑”都针对相同的片段序列进行测试。

我希望它有所帮助!

于 2013-02-24T16:55:54.727 回答