algorithm - minimax 算法通过 alpha beta 剪枝返回不同的值

Question

我正在为国际象棋编写 Minimax 算法。

我得到了不带 alpha beta 剪枝的 minimax 和带 alpha beta 剪枝的 minimax 的不同最终结果值。

我的伪代码如下。谁能帮我？

极小最大值（）

public int miniMax(int depth, Board b, boolean maxPlayer) {
    if(depth == 0)
        return evaluateBoard(b);
    if(maxPlayer) {
        int bestMoveVal = 0;  
        for( each Max player's moves) {
            // make a move on a temp board
            int eval = miniMax(depth - 1, tempBoard, false);
            bestMoveVal = Math.max(bestMoveVal, eval);
        }
        return bestMoveVal;
    }
    else {
        int bestMoveVal = 0; 
        for (each Min player's moves) {
            // make a move on a temp board. 
            int eval = miniMax(depth - 1, tempBoard, true);
            bestMoveVal = Math.max(bestMoveVal, eval);
        }
        return bestMoveVal;
    }
}

字母()

public int alphabeta(int depth, Board b, int alpha, int beta, boolean maxPlayer) {
        if(depth == 0)
            return evaluateBoard(b);
        if(maxPlayer) {
            for(each max player's moves) {
                // make a move on a temp board
                int eval = alphabeta(depth - 1, temp, alpha, beta, false);
                alpha = Math.max(alpha, eval);
                if(beta <= alpha) //beta cut off;
                    break;
            }
            return alpha;
        }
        else {
            for(each of min's moves) {
                // make a move on a temp board
                int eval = alphabeta(depth - 1, temp, alpha, beta, false);
                beta = Math.min(beta, eval);
                if(beta <= alpha)
                    break; // alpha cut off;
            }
            return beta;
        }
    }

Board 代表一个董事会。对于每一步，我都会在传递的 Board 对象的副本上进行移动，然后将这个临时 Board 传递给进一步的调用。

evaluateBoard(Board b) 接收一个 Board 并根据给定的 Board 场景计算分数。

score 3 · Accepted Answer

您的代码中的一个大问题是它alphabeta不是递归的，因为它应该是。它调用miniMax.

中的递归调用alphabeta应该调用alphabeta，否则根本就是错误的。也就是说，在每个深度级别都应用了 alpha-beta 剪枝，而不仅仅是顶层。

在最小化和最大化播放器的minMax功能中bestMoveVal = Math.max(bestMoveVal, eval);。

algorithm - minimax 算法通过 alpha beta 剪枝返回不同的值

1 回答 1

Related

Reference