openai-gym - Openai Universe-starter-agent 未训练

Question

我一直在尝试运行此处找到的 Openai 的 Universe-starter-agent 示例，但是，在 AWS 上使用具有 32 个工作人员的 m4.16xlarge 实例，代理的训练结果在 0.6 小时（超过 30 分钟）后并没有提高，而它是在 GitHub 页面上表示“代理能够在 10 分钟内解决相同的环境”。

通过 TensorBoard 监控进度。请注意，GitHub 中给出的示例是针对 16 个工人的情况，它在 30 分钟内收敛到 21 的情节奖励，而对于这种情况，工人数量翻倍和训练时间相同，奖励不会不改进。我还看了看日志，似乎没有编译错误。我用来运行脚本的命令是：

python train.py --num-workers 32 --env-id PongDeterministic-v3 --log-dir /tmp/pong

我唯一觉得有点可疑的是在运行脚本时，显示了以下错误，但并没有中止运行。错误显示：“无法连接到服务器”

有没有其他人运行启动代理，和/或遇到类似问题？如果是这样，您是如何解决的？

谢谢！

score 0 · Accepted Answer

0

问题已解决 - 将 tensorflow 从 1.0.0 降级到 0.11.0 并按预期进行训练！

于 2017-04-14T06:50:47.033 回答

openai-gym - Openai Universe-starter-agent 未训练

1 回答 1

Related

Reference