我是 RL 的新手,所以如果我问愚蠢的问题,请原谅我:)
我现在正在做一个 DQN 项目,它与最简单的蛇游戏非常相似。该游戏是用js编写的,并有一个演示(其中蛇随机移动)。但是由于我不会写js,所以在trainng过程中无法将动作值传递给游戏,所以我现在正在做的是生成随机游戏图像并训练dqn模型。
我想问的是:这样可以吗?Q(s,r) 还能收敛吗?如果可以的话,有什么需要注意的吗?我还需要 Episilon 参数吗?
非常感谢:)
我是 RL 的新手,所以如果我问愚蠢的问题,请原谅我:)
我现在正在做一个 DQN 项目,它与最简单的蛇游戏非常相似。该游戏是用js编写的,并有一个演示(其中蛇随机移动)。但是由于我不会写js,所以在trainng过程中无法将动作值传递给游戏,所以我现在正在做的是生成随机游戏图像并训练dqn模型。
我想问的是:这样可以吗?Q(s,r) 还能收敛吗?如果可以的话,有什么需要注意的吗?我还需要 Episilon 参数吗?
非常感谢:)