问题标签 [openai-gym]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
10017 浏览

python - 为什么在 200 个时间步后完成情节(健身房环境 MountainCar)?

在 Python 中使用 OpenAI-gym 中的 MountainCar-v0 环境时,完成的值将在 200 个时间步之后为真。这是为什么?因为没有达到目标状态,所以不应该完成这一集。

我想运行 step 方法,直到汽车到达标志,然后打破 for 循环。这可能吗?与此类似的东西:

0 投票
1 回答
1248 浏览

benchmarking - OpenAI Gym 和 Gazebo 测试机器人的 RL 算法?

如果我想研究机器人的 RL 算法,我应该如何使用 GazeboOpenAI Gym 来测试、训练和基准测试算法?我是否应该从 OpenAI Gym 开始,并将得分高的算法带入 Gazebo 环境中以用于实际场景?

0 投票
1 回答
2246 浏览

python - 健身房环境营造

我是 Openai 和 Gym 的新手。我正在使用 Ubuntu 14.04 并安装了所有依赖项。我无法弄清楚构建“新”健身房环境的命令执行顺序。

请参考https://github.com/hackthemarket/gym-trading

当我尝试自己实现相同的功能时,它会显示:

请向我解释此示例中文件的正确执行顺序。

0 投票
0 回答
138 浏览

openai-gym - OpenAI Gym/Universe 中可能发生的事件列表

我正在使用 openai Universe,我希望代理单击“a”“enter”等键,然后在 (x,y) 位置单击鼠标。

任何文档都会很棒。

更新 我发现此链接定义了 KeyEvents 列表: https ://github.com/openai/universe/blob/a7944e65446a5484e5011f048558f312e907da61/universe/vncdriver/constants.py#L85-L170

对于字母,只需传递它:('KeyEvent', "A", True)

对于鼠标(在宇宙代码某处的评论中找到):(“PointerEvent”,x,y,按钮掩码)

在此处输入图像描述

0 投票
1 回答
201 浏览

openai-gym - Openai Universe-starter-agent 未训练

我一直在尝试运行此处找到的 Openai 的 Universe-starter-agent 示例但是,在 AWS 上使用具有 32 个工作人员的 m4.16xlarge 实例,代理的训练结果在 0.6 小时(超过 30 分钟)后并没有提高,而它是在 GitHub 页面上表示“代理能够在 10 分钟内解决相同的环境”。

通过 TensorBoard 监控进度。请注意,GitHub 中给出的示例是针对 16 个工人的情况,它在 30 分钟内收敛到 21 的情节奖励,而对于这种情况,工人数量翻倍和训练时间相同,奖励不会不改进。我还看了看日志,似乎没有编译错误。我用来运行脚本的命令是:

TensorBoard 截图

我唯一觉得有点可疑的是在运行脚本时,显示了以下错误,但并没有中止运行。错误显示:“无法连接到服务器”

底部出现错误

有没有其他人运行启动代理,和/或遇到类似问题?如果是这样,您是如何解决的?

谢谢!

0 投票
4 回答
6577 浏览

deep-learning - OpenAI 健身房:如何在 CartPole-v0 中获取像素

我想在CartPole-v0不打开渲染窗口的情况下访问 OpenAI 健身房环境中的原始像素。我该怎么做呢?

示例代码:

PS。我很难为 OpenAI 健身房找到好的文档。只是我,还是根本不存在?

编辑:我不需要打开渲染视频。

0 投票
1 回答
2459 浏览

openai-gym - Openai-gym : 在 FrozenLake-v0 中设置 is_slippery=False

在 openai-gym 中,我想让 FrozenLake-v0 作为确定性问题工作。所以,我需要设置变量 is_slippery=False。

如何在初始化环境时将其设置为 False?

官方代码中对变量的引用

0 投票
1 回答
123 浏览

artificial-intelligence - 如何使用其他环境

OpenAIuniverse是一个很棒的库,因为代码

已提供“DuskDrive-v0”环境,如何使用其他环境?

0 投票
0 回答
738 浏览

python - Windows 上的 Ubuntu 运行 openAI gym,env.render() 什么也没给出

我在 Windows 上的 Ubuntu 上运行了这段代码,结果只显示为

没有其他的。

0 投票
1 回答
1741 浏览

python - OpenAI Gym 和 Python 线程

我正在研究 A3C/ACER 的变体,我有几个工作人员,每个工作人员都在自己的线程上运行。我正在使用 OpenAI 健身房环境。

Python 线程工作正常,但不能充分利用所有内核。由于没有阻塞 I/O,它不会进行上下文切换。

我希望工作人员在各自的环境中执行操作时以某种方式释放 GIL。

我会很感激您的反馈:这是否有意义并且可能?