0

我为connect-4编写了一些AI。我想调整某些评估函数的权重。我的时间和硬件有限,所以我的问题是:根据使用较低深度搜索获得的结果执行“训练”和调整权重,这对于评估质量是否非常糟糕,而不是在AI 必须在以后有更多时间的情况下发挥其最佳性能,从而可以在更深层次搜索游戏树?

4

1 回答 1

1

好吧,如果您的时间有限,则必须使用较低深度的搜索来调整权重。这与用于制作西洋双陆棋等游戏的时间差异学习的想法非常相似。也就是说,您可能想要使用强化学习的想法。时间差异是强化学习的一种方式。

于 2011-12-13T18:32:25.953 回答