问题标签 [openai-gym]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 为什么在 200 个时间步后完成情节(健身房环境 MountainCar)?
在 Python 中使用 OpenAI-gym 中的 MountainCar-v0 环境时,完成的值将在 200 个时间步之后为真。这是为什么?因为没有达到目标状态,所以不应该完成这一集。
我想运行 step 方法,直到汽车到达标志,然后打破 for 循环。这可能吗?与此类似的东西:
benchmarking - OpenAI Gym 和 Gazebo 测试机器人的 RL 算法?
如果我想研究机器人的 RL 算法,我应该如何使用 Gazebo和OpenAI Gym 来测试、训练和基准测试算法?我是否应该从 OpenAI Gym 开始,并将得分高的算法带入 Gazebo 环境中以用于实际场景?
python - 健身房环境营造
我是 Openai 和 Gym 的新手。我正在使用 Ubuntu 14.04 并安装了所有依赖项。我无法弄清楚构建“新”健身房环境的命令执行顺序。
请参考https://github.com/hackthemarket/gym-trading。
当我尝试自己实现相同的功能时,它会显示:
请向我解释此示例中文件的正确执行顺序。
openai-gym - OpenAI Gym/Universe 中可能发生的事件列表
我正在使用 openai Universe,我希望代理单击“a”“enter”等键,然后在 (x,y) 位置单击鼠标。
任何文档都会很棒。
更新 我发现此链接定义了 KeyEvents 列表: https ://github.com/openai/universe/blob/a7944e65446a5484e5011f048558f312e907da61/universe/vncdriver/constants.py#L85-L170
对于字母,只需传递它:('KeyEvent', "A", True)
对于鼠标(在宇宙代码某处的评论中找到):(“PointerEvent”,x,y,按钮掩码)
openai-gym - Openai Universe-starter-agent 未训练
我一直在尝试运行此处找到的 Openai 的 Universe-starter-agent 示例,但是,在 AWS 上使用具有 32 个工作人员的 m4.16xlarge 实例,代理的训练结果在 0.6 小时(超过 30 分钟)后并没有提高,而它是在 GitHub 页面上表示“代理能够在 10 分钟内解决相同的环境”。
通过 TensorBoard 监控进度。请注意,GitHub 中给出的示例是针对 16 个工人的情况,它在 30 分钟内收敛到 21 的情节奖励,而对于这种情况,工人数量翻倍和训练时间相同,奖励不会不改进。我还看了看日志,似乎没有编译错误。我用来运行脚本的命令是:
我唯一觉得有点可疑的是在运行脚本时,显示了以下错误,但并没有中止运行。错误显示:“无法连接到服务器”
有没有其他人运行启动代理,和/或遇到类似问题?如果是这样,您是如何解决的?
谢谢!
deep-learning - OpenAI 健身房:如何在 CartPole-v0 中获取像素
我想在CartPole-v0
不打开渲染窗口的情况下访问 OpenAI 健身房环境中的原始像素。我该怎么做呢?
示例代码:
PS。我很难为 OpenAI 健身房找到好的文档。只是我,还是根本不存在?
编辑:我不需要打开渲染视频。
openai-gym - Openai-gym : 在 FrozenLake-v0 中设置 is_slippery=False
在 openai-gym 中,我想让 FrozenLake-v0 作为确定性问题工作。所以,我需要设置变量 is_slippery=False。
如何在初始化环境时将其设置为 False?
artificial-intelligence - 如何使用其他环境
OpenAIuniverse
是一个很棒的库,因为代码
已提供“DuskDrive-v0”环境,如何使用其他环境?
python - Windows 上的 Ubuntu 运行 openAI gym,env.render() 什么也没给出
我在 Windows 上的 Ubuntu 上运行了这段代码,结果只显示为
没有其他的。
python - OpenAI Gym 和 Python 线程
我正在研究 A3C/ACER 的变体,我有几个工作人员,每个工作人员都在自己的线程上运行。我正在使用 OpenAI 健身房环境。
Python 线程工作正常,但不能充分利用所有内核。由于没有阻塞 I/O,它不会进行上下文切换。
我希望工作人员在各自的环境中执行操作时以某种方式释放 GIL。
我会很感激您的反馈:这是否有意义并且可能?