我目前正在研究组合博弈论,并且正在尝试使用神经网络开发人工智能。我最初的方法是获取游戏的统计数据并将其用作输入,并训练我的神经网络为这些输入开发最佳权重配置,以获得这些输入的最大输出值。每组输入代表一个动作,通过将每个动作(输入 x 权重)传递给神经网络,我可以找出哪个动作具有最大值。因此,这一举措将是最好的举措。
这都是理论上的,我只是好奇在不知道期望值的情况下构建神经网络是否是可能的。如果这看起来不合理,是否有任何其他算法我应该研究这类问题?
感谢您的任何反馈,在此先感谢您。
我目前正在研究组合博弈论,并且正在尝试使用神经网络开发人工智能。我最初的方法是获取游戏的统计数据并将其用作输入,并训练我的神经网络为这些输入开发最佳权重配置,以获得这些输入的最大输出值。每组输入代表一个动作,通过将每个动作(输入 x 权重)传递给神经网络,我可以找出哪个动作具有最大值。因此,这一举措将是最好的举措。
这都是理论上的,我只是好奇在不知道期望值的情况下构建神经网络是否是可能的。如果这看起来不合理,是否有任何其他算法我应该研究这类问题?
感谢您的任何反馈,在此先感谢您。