好的,我基本上了解 MCTS 如何与节点选择等一起工作。我不明白的是随机推出阶段。我随机模拟未来的游戏步骤直到它以输赢结束,这是否正确?对于具有许多状态和可能的动作以及未知敌人动作的更复杂的游戏,推出是否需要很长时间?如果你随机推出敌人的动作直到你到达游戏结束,那么随机返回输赢不是很好吗?如果有人可以用一个简单的例子(比如 3 步或 4 步游戏)来解释推出阶段,我会很高兴。
提前致谢。
好的,我基本上了解 MCTS 如何与节点选择等一起工作。我不明白的是随机推出阶段。我随机模拟未来的游戏步骤直到它以输赢结束,这是否正确?对于具有许多状态和可能的动作以及未知敌人动作的更复杂的游戏,推出是否需要很长时间?如果你随机推出敌人的动作直到你到达游戏结束,那么随机返回输赢不是很好吗?如果有人可以用一个简单的例子(比如 3 步或 4 步游戏)来解释推出阶段,我会很高兴。
提前致谢。