背景:效用理论 Game AI 问题:如何解决死锁?场景:RTS 游戏 - 双方在游戏中只剩下一个单位,没有资源可以建造更多。
考虑只存在于封闭世界中的两个实体大猩猩和鲨鱼(模拟) 大猩猩和鲨鱼都由效用理论 AI 驱动
两者都不知道其他人的能力。双方都不知道如果发生战斗谁会赢。双方都不知道对方的位置。
从大猩猩的角度来看(也很容易成为鲨鱼):
为了最大限度地发挥效用,它必须与鲨鱼战斗并击败它。
为了与鲨鱼战斗,大猩猩必须首先侦察鲨鱼。但是这样做可能会“撞上”鲨鱼并最终打架。
如果大猩猩要与鲨鱼战斗,它可能会失败,在这种情况下,这将与最大化效用相反。
因此,在这种情况下,效用理论 AI 最终只会出现在大猩猩和鲨鱼故意避开对方的地方。
然后这变成了僵局。之所以如此,是因为回避对方也是一种效用最大化的形式。
要打破僵局,需要让游戏 AI 随机使用非最优规则。例如“随机计划外攻击”
本质上,您如何将“结果未知”场景(或动作不确定的场景)建模为效用理论 AI。还是引入随机行为是唯一的方法?