1

我正在使用维基百科伪代码来针对 -

function alphabeta(node, depth, α, β, Player)         
    if  depth = 0 or node is a terminal node
        return the heuristic value of node
    if  Player = MaxPlayer
        for each child of node
            α := max(α, alphabeta(child, depth-1, α, β, not(Player) ))     
            if β ≤ α
                break                             (* Beta cut-off *)
        return α
    else
        for each child of node
            β := min(β, alphabeta(child, depth-1, α, β, not(Player) ))     
            if β ≤ α
                break                             (* Alpha cut-off *)
        return β

这是我的java实现 -

private int alphabeta(Node newNode, int depth, int alpha, int beta, boolean Player) {
    Integer[] children;
    if(depth == 0 || newNode.allNodesFull()){
        return (newNode.blacknodes() - newNode.whitenodes());
    }
    if(Player == false){
        children = newNode.findMovesBlack();
        Arrays.sort(children);
        for(Integer child: children){
            nodesGenerated ++;
            alpha = Math.max(alpha, alphabeta(new Node(newNode.move(child), true),
                            depth - 1, alpha, beta, !Player));
            if(beta <= alpha)
                break;
        }return alpha;
    }else{
        children = newNode.findMovesWhite();
        Arrays.sort(children);
        for(Integer child: children){
            nodesGenerated ++;
            beta  = Math.min(beta, alphabeta(new Node(newNode.move(child), false), 
                            depth - 1, alpha, beta, !Player));
            if(beta <= alpha)
                break;
        }return beta;
    }
} 

在对我的代码进行了一些修改之后,它不再存在提前返回的问题,但是我确实遇到了 alpha 和 beta 永远不会改变的问题

我会解释发生了什么,假设他们工作

findMovesBlack() 和 findMovesWhite() 都返回 Integer[] 数组,其中包含任一玩家可以移动的可能位置,无论轮到谁。对于黑白棋的初始位置,findMovesBlack() 将返回 [19, 26, 37, 44]

如果 findMovesBlack() 和 findMovesWhite() 的长度都为 0,则 allNodesFull() 返回一个布尔值。

blacknodes() 和 whitenodes() 分别返回黑色或白色节点的数量。

Node.move(int coordinate) 返回一个 String[] 数组,其中包含已翻转和放置的新位置。相信我,它工作正常。

a Node(String[] gameboard, boolean player-to-move) 只是使用我们找到的参数设置了一个新位置。

我相信这就是你需要看到的。我已经解决了后端的所有问题。

4

1 回答 1

0

答案在于 beta 和 alpha 值的实现。我不得不经常弄乱相对于 = 符号的位置。

于 2012-09-19T07:29:38.303 回答