问题标签 [openai-gym]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
784 浏览

python - tflearn 创建多个模型

我正在使用tflearngym编写机器学习脚本。

我可以让一个网络在我的python -script 中工作,但是每当我尝试调用我的函数来构建第二个或第三个网络并使用model.fit对其进行训练时,我都会得到一个

tensorflow.python.framework.errors_impl.InvalidArgumentError

编辑; 目标应该是建立几个不同的网络以便比较它们。首先,这应该只关注 input_data 和训练时期的数量,但最后,我想比较不同的网络大小。此外,我想循环运行它,建立两个以上的网络。

以下代码重现了我的错误:

  • 初始人口(人口大小)

创建一个随机动作数组,大小为 pop_size

  • 神经网络模型(输入大小):

创建一个神经网络

  • 训练模型(训练数据)

如果没有通过,则创建一个新模型,并根据提供的训练数据训练模型

输出:

关键部分似乎是,函数model.fit在第二次被调用时没有得到正确的数据类型。看起来这两个实例可能共享一些变量、数据等,这搞砸了。

对于常规的张量流,我已经看到您可能必须为每个新模型进行单独的会话,但我不知道这是否适用于 tflearn 包。

我正在使用 Windows 10 和 Python 3.6。

0 投票
0 回答
185 浏览

python - 神经网络产生相同的输出。请。飞扬的鸟

第一次在这里发帖,但我真的可以使用一些反馈或任何提示。我的 AI 课程学期项目基本上是编写一个程序来学习如何玩 Flappy Bird。我在网上找到了一个很好的教程。https://pythonprogramming.net/openai-cartpole-neural-network-example-machine-learning-tutorial/我的代码主要基于此。我改变了某些方面,以便我可以让它为 Flappy Bird 而不是 carpole 工作。然而,在所有这些修改之后,我遇到了一个问题,这只是我的代码总是产生 0 的输出,然后这只鸟就掉了下来。任何帮助、批评或想法将不胜感激。谢谢。

0 投票
1 回答
9657 浏览

python-3.x - OpenAI 的 env.render() 后出错

我试图让下面的代码工作。

我运行前 3 行没有问题,但是当我运行第 4 行时出现错误:

我希望能在杆子上放一辆手推车,以便在新窗口中展示。

此错误来自 Spyder 中的代码。我正在使用 ubuntu 16.04;蟒蛇3.6.3;IPython 6.1.0。我没有使用 jupyter notebook 的运气。

我再次道歉。我对今天刚刚下载的 ubuntu 很陌生。

0 投票
2 回答
4683 浏览

video - 有没有办法在录制的同时禁用 OpenAI 健身房中的视频渲染?

有没有办法在录制的同时禁用 OpenAI 健身房中的视频渲染?

当我使用 atari 环境和Monitor包装器时,默认行为是不渲染视频(视频仍被记录并保存到磁盘)。但是,在简单的环境中,例如MountainCarContinuous-v0, CartPole-v0, Pendulum-v0,渲染视频是默认行为,我找不到如何禁用它(我仍然想将它保存到磁盘)。

我在服务器上运行我的作业,官方建议的解决方法xvfb不起作用。我看到很多人都遇到了问题,因为它与 nvidia 驱动程序发生冲突。我找到的最常见的解决方案是重新安装 nvidia 驱动程序,但我不能这样做,因为我没有对服务器的 root 访问权限。

0 投票
1 回答
652 浏览

python-3.x - OpenAI Gym Atari Baseline deepq train.py 失败

我试图在OpenAI 的 DQN基线上训练 Atari 2600 游戏 Frostbite。我正在使用 Linux 和 Python 3。在花了一些时间尝试运行它之后,我注意到了几个问题:

  1. from baselines.common.atari_wrappers_deprecated import wrap_dqn 没有被认出来。在网上搜索后,我发现这是一个快速修复: from baselines.common.atari_wrappers import wrap_deepmind

  2. 之后当我运行代码时,我在experiments/atari/train.py 的第246 行收到以下错误:

start_time, start_steps = time.time(), info["steps"] KeyError: 'steps'

我注意到其他几个人在过去 15 天左右出现了这个问题,但还没有任何回应。我是 RL 的新手,所以没有太多的想法。有人有想法吗?

0 投票
0 回答
63 浏览

python - 如何以相当快的速度从 MountainCar 多次(>1000)实现目标中制作视频

我想制作一段从 MountainCar 多次到达目标(标志位置>.5)的视频。我正在使用 openai 的 MountainCar-v0(步骤和奖励限制有所变化),但达到目标需要很多时间。我正在使用以下代码:

如何更改此设置以帮助代理更快地达到目标?谢谢

0 投票
1 回答
3164 浏览

python - Jupyter notebooks 中 AI-Gym Python 图形的难点

我正在尝试让 AI-Gym 演示在 Jupyter 笔记本中显示。我在 Atari 演示中得到了很好的结果,Breakout-v0而在 cart-pole 演示中得到了一个困难的错误消息CartPole-v0。两者都可以在笔记本电脑之外正常工作。以下是最小的细节:

没有木星

在控制台:

结果:

在此处输入图像描述

现在,同样使用 cart-pole,在一个新的 Python 会话中:

与上面 Python 代码的唯一区别是演示的名称:CartPole-v0而不是Breakout-v0.

结果: 在此处输入图像描述

与木星

遵循这个 SO 问题的一些提示:How to run OpenAI Gym .render() over a server,我有这个用于Breakout演示:

在此处输入图像描述

或者,在文本中:

现在,对于购物车杆,再次使用新的内核会话和笔记本,唯一的区别是演示的名称:

我收到一条很长的错误消息,抱怨某些 pyglet 类是抽象的。堆栈跟踪的最后一个元素如下:

整个堆栈跟踪位于底部以供检查。我通读了它,但无法确定问题以及如何解决它。我会很感激你的建议。

总结一下,

整个堆栈跟踪如下:

0 投票
0 回答
524 浏览

tensorflow - 在 Tensorforce 中渲染 OpenAI 环境

我正在训练代理使用 Tensorforce 在 OpenAI 中玩 HalfCheetah-v1 环境。我能够训练代理并获得奖励,但在模型完成运行后我无法实际渲染环境。我使用以下代码保存了模型:

这工作正常。但是,当我想再次加载模型以渲染经过训练的代理时,出现以下错误:

下面的代码是我实际用于渲染环境的代码。

我的tensorforce版本号是0.3.3,我的tensorflow-gpu版本号是1.4.1。请让我知道我应该如何解决这个错误。

0 投票
0 回答
1013 浏览

python - AttributeError:“模块”对象在使用 OpenAI 健身房运行 Box2d 时没有属性“RAND_LIMIT”

我已经使用 pip install 安装了 box2d,但是当我使用 python 为 box2d 游戏运行 OpenAI 健身房环境时。就我而言,我正在尝试运行 LunarLander 环境:-

我收到此错误:

0 投票
1 回答
232 浏览

python - python中的_是什么意思

从 openAI 健身房环境的 step 函数获取输出时 _ 用作第四个变量。是否仅用于我们不想使用的值?使用 _ 而不是任何其他名称有什么好处吗?