简化游戏规则:
- 棋子每回合可以移动一次。
- 棋子可以向 4 个方向移动。(上下左右)
- 棋子像棋盘一样在网格上移动。
- 到达对方行的棋子获胜。
- 为简单起见,可以忽略其他规则。
评价功能:
- 如果
reached to the target, return 100.
- 其他:
return Opponent Distance From Target
-Own Distance From Target
我minimax
使用alpha-beta pruning
并指定了一个max-depth
. 我将我的实现与几个 3rd 方实现进行了比较,它看起来是一样的。因此,我不想粘贴我的实现,而是想直接问我的问题:
当 2 个 AI 相互竞争时。一旦他们检测到其中任何一个赢得比赛,他们就无法选择有意义的方向,因为超过 1 个选择的得分相同。随机选择这些选项中的任何一个,都不会改善它,因为它们永远毫无意义地移动。
这是(死锁)预期的事情吗?如果不是,可能是什么问题?如果是这样,我该如何解决?