0 投票

1 回答

347 浏览

c++ - Tic Tac Toe Minimax 算法返回空板

几天来，我一直在努力为井字游戏 AI 实施 miniMax 算法。现在，我遇到的问题是，当我调用 minimax() 函数时，我在“returnBoard”输入中得到一个空板。我知道我的算法正在遍历一系列棋盘，因为我已经打印出了孩子们，我看到计算机正在移动并给棋盘打分。有什么建议么？

这是整个可运行的内容。

c++tic-tac-toe minimax alpha-beta-pruning

user3126362

2014-01-27T02:09:12.847

0 投票

1 回答

218 浏览

algorithm - 如何在转置表中说明位置的历史

我目前正在为一个名为Skat的基于技巧的纸牌游戏开发一个求解器，它在完美的信息情况下。虽然大多数人可能不知道这个游戏，但请多多包涵；我的问题是一般性的。

Skat简介：
基本上，每个玩家交替打一张牌，每三张牌形成一个花样。每张卡都有特定的价值。玩家获得的分数是相应玩家赢得的技巧中包含的每张牌的值相加的结果。我遗漏了一些对我的问题不重要的事情，例如谁和谁比赛或者我什么时候赢得一墩。
我们应该记住的是，有一个运行分数，并且在调查某个位置（->它的历史）时谁玩过什么与该分数相关。

我用 Java 编写了一个 alpha beta 算法，它似乎工作正常，但它太慢了。似乎最有希望的第一个增强是使用转置表。我读到，在搜索 Skat 游戏的树时，您会遇到很多已经调查过的位置。
这就是我的问题发挥作用的地方：如果我找到一个之前已经调查过的位置，那么导致这个位置的动作会有所不同。因此，一般来说，分数（以及 alpha 或 beta）也会有所不同。
这引出了我的问题：如果我知道相同头寸的价值，但历史不同，我如何确定头寸的价值？
换句话说：我怎样才能解耦从其路径到根的子树，以便可以将其应用于新路径？
我的第一个冲动是这是不可能的，因为 alpha 或 beta 可能受到其他路径的影响，这可能不适用于当前位置，但是......

似乎已经有一个解决方案
......我似乎不明白。在 Sebastion Kupferschmid 关于 Skat 求解器的硕士论文中，我发现了这段代码（可能是 C-ish / 伪代码？）：

这应该是不言自明的。succ(p)是一个返回当前位置所有可能移动的函数。t(q)是我认为是各个位置的跑分（庄家到目前为止所获得的分数）。因为我不喜欢在不理解的情况下复制东西，所以这应该只是对任何想帮助我的人的帮助。当然，我已经对这段代码进行了一些思考，但我无法理解一件事：通过在再次调用函数之前从 alpha/beta 中减去当前分数 [例如] ab_tt(q, res - t(q), beta - t(q))，似乎存在某种解耦上。但是，如果我们将位置的值存储在转置表中而不在这里也进行相同的减法，那么究竟有什么好处呢？如果我们找到了一个之前调查过的位置，为什么我们可以只返回它的值（如果它是VALID）或者使用 alpha 或 beta 的绑定值？在我看来，从转置表存储和检索值都不会考虑这些位置的特定历史。还是会？

文献：
几乎没有英文资料涉及 skat 游戏中的 AI，但我发现了这个：A Skat Player Based on Monte Carlo Simulation by Kupferschmid, Helmert。不幸的是，整篇论文，尤其是对转置表的阐述相当紧凑。

编辑：

为了让每个人都能更好地想象在所有牌都打完之前，在 Skat 游戏中比分是如何发展的，这里有一个例子。游戏进程显示在下表中，每行一招。每墩牌后的实际分数在左侧，其中+X是庄家的分数（-Y是防守方的分数，与alpha beta 无关）。正如我所说，一招的获胜者（宣布者或防守队）将这一招中每张牌的价值添加到他们的分数中。

卡值如下：

algorithm artificial-intelligence minimax game-theory alpha-beta-pruning

2014-02-10T21:43:12.760

0 投票

1 回答

952 浏览

chess - 有时间限制的迭代深化

我正在为计算机国际象棋程序的 alpha-beta 搜索实现迭代深化，并希望包含搜索的时间限制。我想知道在深度为 5 的搜索中达到时间限制的后果。如果这个不完整的搜索找到了一个新的主要变体，那是否可以保证至少与深度为 4 的完整搜索发现的主要变异？否则，我似乎应该丢弃在 5 深度处通过不完整搜索找到的任何内容。

chess alpha-beta-pruning iterative-deepening

2014-02-14T06:13:32.693

0 投票

0 回答

1279 浏览

artificial-intelligence - 带有机会节点的游戏树中的 alpha beta 修剪

我正在尝试使用机会节点在游戏树中学习 alpha beta 修剪，所以我找到了一个示例并在解决我的树后对其进行了研究，它看起来像这样：

在此处输入图像描述

现在我有几个问题：

首先，如果我们想象叶子的范围是 -infinity 和 +infinity，我可以说只有被修剪的节点是最右边的节点吗？
另一个问题是，如果我们想象叶子的范围是从-2到2，我可以说只有下图中的圆圈区域会被修剪（或者也许我错了，它不应该被修剪）？

在此处输入图像描述

artificial-intelligence alpha-beta-pruning

2014-03-01T15:51:26.260

0 投票

1 回答

302 浏览

algorithm - Tic Tac Toe 使用带有 alfa-beta 修剪的 min - max 方法实现有没有更好的解决方案？

有一个代码实现函数，它为每个状态分配一个值（min-max 方法的两个部分）

algorithm artificial-intelligence tic-tac-toe minimax alpha-beta-pruning

2014-03-31T10:33:40.717

0 投票

1 回答

118 浏览

alpha-beta-pruning - Alpha-Beta 修剪何时效率低下

是否有任何情况可以说 Alpha-Beta 修剪效率低下。换句话说，假设我们有一场比赛，你必须达到 27 才能获胜，而你和你的对手每次加起来可能只能使用 1,2,5。那么Alpha-Beta修剪在这里有效吗？以这种方式评估它是不是有点令人困惑，尤其是在我们的案例开始时，有很多我们并不真正关心的可能性？

我觉得我可以解释这一点，但我不能！帮助。

alpha-beta-pruning

2014-05-01T23:41:50.150

0 投票

1 回答

3433 浏览