我正在为一款 rts 游戏编写机器人。
我正在使用模糊逻辑来评估当前位置(我的和敌人的)并发出命令。
我有几个模糊变量:military_buildings
、civilian_building
、army_power
和。我也有几个模糊的语言值,如, , , , 。enemy_power
distance
VERY_GOOD
GOOD
NORMAL
BAD
VERY_BAD
我的下一个任务是让机器人学习,避免所有人都以同样的方式行事。任何建议或想法如何解决这个问题?
使用 GA 来调整参数(但我不知道玩家的评分,所以我不知道 bot 是赢了弱玩家还是输给了强玩家)。
有没有人有类似问题的经验(如果有更简单的方法可以从经验中学习机器人,我可以更改实现并替换模糊逻辑)?