我正在做一个项目,我有神经网络(或其他算法)在扑克中互相玩。在每次输赢之后,我希望神经网络(或其他算法)根据损失的错误进行更新(这里如何计算并不重要)。
Weka 非常好,我不想重新发明轮子。然而,Weka 的 API 似乎主要设计用于从数据集进行训练。玩游戏不使用数据集。相反,网络播放,然后我希望它根据其损失进行自我更新。
是否可以使用 Weka API 在一个实例上更新网络而不是数据集并一遍又一遍地执行此操作?我在想这个对吗?
我还想实现的另一个想法是使用遗传算法来更新神经网络中的权重,而不是反向传播算法。据我所知,没有办法在 Weka 中手动指定神经网络的权重。如果为此目的使用遗传算法,这当然是至关重要的。
请帮忙 :) 谢谢。