问题标签 [keras-rl]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
14 浏览

python - Keras DQNAgent 在第二次迭代中输出不同形状的预测

我正在使用带有 BipedalWalker-v3 环境的 python gym。设置 DQNAgent 时出现以下错误

我在gym 包内的.step() 函数中添加了一些打印函数(就在else: 行的下方),以查看我为action 变量获得了什么输入。

我得到以下输出:

训练1000步...

动作输入:[0 0 0 0]

动作输入类型:<class 'numpy.ndarray'>

间隔 1(执行 0 步)

动作输入:3

动作输入类型:<class 'numpy.int32'>

(索引错误)

从我可以看到第二次将动作变量提供给健身房环境步骤函数,它是以 int 的形式而不是应有的数组形式。

对此的任何帮助将不胜感激。

完整代码如下: