0

我一直在尝试为一个简单的游戏实现一个 minMax 算法(稍后将尝试进行字母修剪)......我看过很多伪代码和教程,但我就是无法让它工作......

一点帮助将不胜感激:)

这是相关的类...(为清楚起见,删除了实现)

class Board { //Stores board state, Immutable

    Board playMove(Move m); //generates new Board after playing "Move m"

    List<Move> nextMoves(Move m); // generates all possible moves, previous move is required to decide the validity of the next moves

    boolean isTerminal(); //board at terminal state?
}


class Move { //stores positions played and score gained from that move

}

这是我的最小-最大实现......有人可以指出我做错了什么吗?谢谢你。

private Move bestMove = null; // field variable

private int maxMove(Board board, Move prevMove, int myScore, int oppnScore) {
    out("maxMove " + board );
    if(board.isTerminal()) {
        return myScore - oppnScore;
    }
    int mx = Integer.MIN_VALUE;
    for(Move nxtMove: board.nextMoves(prevMove)) {
        int k = minMove(board.playMove(nxtMove),
                        nxtMove,
                        myScore + nxtMove.score,
                        oppnScore);
        if(k > mx) {
            mx = k;
            bestMove = nxtMove;
        }
    }
    return mx;
}

private int minMove(Board board, Move prevMove, int myScore, int oppnScore) {
    if(board.isTerminal()) {
        return myScore - oppnScore;
    }
    out("minMove " + board );
    int mn = Integer.MAX_VALUE;
    for(Move nxtMove: board.nextMoves(prevMove)) {
        int k = maxMove(board.playMove(nxtMove),
                        nxtMove,
                        myScore,
                        oppnScore + nxtMove.score);
        if(k < mn) {
            mn = k;
            bestMove = nxtMove;
        }
    }
    return mn;
}

编辑:游戏的简要说明如下,你面前有一定数量的不同面额的硬币。您和另一名玩家轮流从任一侧(左侧或右侧)取出一枚硬币。硬币的面额表示您为该动作得分。某些硬币具有特殊含义,例如选择 X 表示您将跳过一个回合,或者 Y 表示您将再获得一个回合。你的目标是比你的对手得分更多。

4

2 回答 2

0

我只看到一个错误:你不记得你为给定的棋盘状态选择了哪一回合,所以你计算了很多次,算法变得很慢。还是速度不是你的问题?

于 2011-03-15T08:56:05.517 回答
0

我觉得我不是很清楚游戏规则,但看起来你的终端条件不太正确。

您正在返回玩家之间的得分差异。这意味着一个玩家想要最大化这个值(与对手的最大差异),而另一个想要最小化这个值(他试图获得与对手最接近的分数)。这看起来不像任何真实游戏的目标。

我想你想要的是得分最高的玩家获胜。因此,您可以检查 myScore>oppScore 并相应地返回 1,0 和 -1。这意味着第一个玩家想要最大化回报(即他试图使其成为 1 - 他获胜),而对手试图最小化回报(即如果它是 -1 他获胜)。如果没有获胜,他们宁愿选择 0(平局)。

另外,为什么需要prevMove生成下一步?没有board关于游戏当前状态的所有信息(即剩下的硬币)?

于 2011-03-15T09:15:49.430 回答