目前我正在做一个项目,我正在为游戏创建一个 AI 播放器。我正在使用 UCT 算法,我计划添加对对手移动的预测。为此,我想使用神经网络,但遇到了一些问题:
已经有一些数据我想为默认玩家构建一个基本的神经网络,即我以前从未见过的玩家。问题是我想更新这个网络,以便它适应每个特定的对手。我曾尝试搜索在线神经网络算法,但到目前为止还不是很成功。你能给我一些建议如何实施吗?如何在不完全从头开始训练的情况下根据新数据更新参数?
编码是用 Java 完成的,我尝试使用 Weka 来处理我拥有的数据。然而,我在那里找到的唯一神经网络分类器是多层感知器。我熟悉单层感知器,我知道它的输出不是概率(与对数线性或朴素贝叶斯分类器相反)。多层感知器也不是生成器吗?如果是这样,使用它输出的这些“分数”作为概率有多不准确?我应该使用不同的神经网络算法吗?如果是这样,是否有可用的 Java 库?
非常感谢你。