我有一个特定的游戏,它不是字面上的零和游戏,因为积分是在比赛中由游戏授予的,但接近它,在总分的数量有明确上限的意义上,所以你的积分越多得分,您的对手可获得的分数越少。游戏由 5 名玩家进行,没有任何团队。
我正在做一个遗传算法,在几代人之间用伪随机“突变”来对抗自己。
但在几百代之后,总会出现一种模式。该算法最终强烈支持特定玩家(例如:首先玩的玩家)。由于提供“最佳结果”的突变可以作为下一代的基础,这似乎朝着“如果你是第一个玩家,就这样玩(这种方式是一种非常具体但相当随机的技术,糟糕的,或者充其量是平均的结果),如果不是,那么就以这种间接但强烈有利于第一个玩家的特定方式进行游戏”。
然后,对于下一代,轮到被强烈支持的玩家开始完全随机变异,因为无论它做什么,只要算法中支持该玩家的部分仍然完好无损,它就会赢得每一轮。
我正在寻找一种方法来阻止这种特定的进化路线,但我无法弄清楚如何通过你自己的策略来“奖励”胜利而不是胜利,因为你得到了很多帮助。