我正在参加一个编程竞赛,目标是编写一个可以玩特定游戏的机器人。游戏的目标是获得一定数量的积分。您控制多艘飞艇,您可以四处移动,捕获岛屿并导航携带宝藏的无人机。您与一个对手比赛,回合同时发生,并且有时间限制。您可以在一回合内移动多艘船和无人机。您可以使用 Python、Java 或 C# 对您的机器人进行编程。确切的细节无关紧要,只是每艘船每轮大约有 15 个选项(移动和射击),总体而言,每轮大约有 10000 个不同的选项(飞艇运动和射击的不同配置) 直到现在我参加了这个比赛天真,并且没有做任何特别聪明的事情(例如,如果靠近敌人,射击)。我已经阅读了极小极大算法,我真的很想在这里应用它(或类似的东西),你可以假设我可以判断一个状态的值。我的问题是每一回合都有大量的选择——这会产生一个巨大的分支因素,让我无法深入。
问题 1:有没有更好、更适用的方法来解决这个问题?也许是深度学习或类似的东西?问题2:有没有办法最小化分支因子?我已经阅读了有关 alpha-beta 和类似算法的信息,但似乎没有任何作用。
任何帮助将非常感激