0

我一直在尝试运行此处找到的 Openai 的 Universe-starter-agent 示例但是,在 AWS 上使用具有 32 个工作人员的 m4.16xlarge 实例,代理的训练结果在 0.6 小时(超过 30 分钟)后并没有提高,而它是在 GitHub 页面上表示“代理能够在 10 分钟内解决相同的环境”。

通过 TensorBoard 监控进度。请注意,GitHub 中给出的示例是针对 16 个工人的情况,它在 30 分钟内收敛到 21 的情节奖励,而对于这种情况,工人数量翻倍和训练时间相同,奖励不会不改进。我还看了看日志,似乎没有编译错误。我用来运行脚本的命令是:

python train.py --num-workers 32 --env-id PongDeterministic-v3 --log-dir /tmp/pong

TensorBoard 截图

我唯一觉得有点可疑的是在运行脚本时,显示了以下错误,但并没有中止运行。错误显示:“无法连接到服务器”

底部出现错误

有没有其他人运行启动代理,和/或遇到类似问题?如果是这样,您是如何解决的?

谢谢!

4

1 回答 1

0

问题已解决 - 将 tensorflow 从 1.0.0 降级到 0.11.0 并按预期进行训练!

于 2017-04-14T06:50:47.033 回答