问题标签 [openai-gym]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

738 问题

0 投票

2 回答

10017 浏览

python - 为什么在 200 个时间步后完成情节（健身房环境 MountainCar）？

在 Python 中使用 OpenAI-gym 中的 MountainCar-v0 环境时，完成的值将在 200 个时间步之后为真。这是为什么？因为没有达到目标状态，所以不应该完成这一集。

我想运行 step 方法，直到汽车到达标志，然后打破 for 循环。这可能吗？与此类似的东西：

python openai-gym

2017-03-14T13:55:06.900

0 投票

1 回答

1248 浏览

benchmarking - OpenAI Gym 和 Gazebo 测试机器人的 RL 算法？

如果我想研究机器人的 RL 算法，我应该如何使用 Gazebo和OpenAI Gym 来测试、训练和基准测试算法？我是否应该从 OpenAI Gym 开始，并将得分高的算法带入 Gazebo 环境中以用于实际场景？

2017-03-27T14:34:34.780

0 投票

1 回答

2246 浏览

python - 健身房环境营造

我是 Openai 和 Gym 的新手。我正在使用 Ubuntu 14.04 并安装了所有依赖项。我无法弄清楚构建“新”健身房环境的命令执行顺序。

请参考https://github.com/hackthemarket/gym-trading。

当我尝试自己实现相同的功能时，它会显示：

请向我解释此示例中文件的正确执行顺序。

python jupyter-notebook reinforcement-learning openai-gym

2017-04-07T09:47:22.723

0 投票

0 回答

138 浏览

openai-gym - OpenAI Gym/Universe 中可能发生的事件列表

我正在使用 openai Universe，我希望代理单击“a”“enter”等键，然后在 (x,y) 位置单击鼠标。

任何文档都会很棒。

更新我发现此链接定义了 KeyEvents 列表： https ://github.com/openai/universe/blob/a7944e65446a5484e5011f048558f312e907da61/universe/vncdriver/constants.py#L85-L170

对于字母，只需传递它：('KeyEvent', "A", True)

对于鼠标（在宇宙代码某处的评论中找到）：（“PointerEvent”，x，y，按钮掩码）

openai-gym

2017-04-07T10:05:02.863

0 投票

1 回答

201 浏览

openai-gym - Openai Universe-starter-agent 未训练

我一直在尝试运行此处找到的 Openai 的 Universe-starter-agent 示例，但是，在 AWS 上使用具有 32 个工作人员的 m4.16xlarge 实例，代理的训练结果在 0.6 小时（超过 30 分钟）后并没有提高，而它是在 GitHub 页面上表示“代理能够在 10 分钟内解决相同的环境”。

通过 TensorBoard 监控进度。请注意，GitHub 中给出的示例是针对 16 个工人的情况，它在 30 分钟内收敛到 21 的情节奖励，而对于这种情况，工人数量翻倍和训练时间相同，奖励不会不改进。我还看了看日志，似乎没有编译错误。我用来运行脚本的命令是：