问题标签 [openai-gym]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
221 浏览

python - 无法禁用 FCEUX 2.2.2 的 GUI

我正在尝试在没有图形渲染的情况下在 AWS 上运行 FCEUX 模拟器,以便我的机器学习算法可以更快地训练。到目前为止,我已经尝试使用以下命令从命令行运行 FCEUX:

第一行编译并运行 rom,但模拟器的 GUI 仍然显示。

第二行给出了错误

目前我使用的是 Ubuntu 16.04、Python 2.7 和 FCEUX 2.2.2。任何帮助表示赞赏。

0 投票
1 回答
2066 浏览

c++ - Mujoco 入门步骤:缺少 Simulate.cpp 的共享库

我正在尝试从 ubuntu 17.04(最新版本)安装 Mujoco(没有成功)。

说明网站:入门

版本:mjpro150 linux 和/或 mjpro140 linux

我已经有执照了。

按照以下步骤:

将带有激活密钥的 mjkey.txt 放在 bin = ok 上

运行模拟.cpp =错误

情况:

目录

小路

Mujoco的命令步骤和错误

试图编译?!(从入门开始)

问题:有人知道我如何进行吗?

0 投票
1 回答
276 浏览

reinforcement-learning - 函数逼近器和 q 学习

我正在尝试使用动作值近似函数来实现 q-learning。我正在使用 openai-gym 和“MountainCar-v0”环境来测试我的算法。我的问题是,它根本没有收敛或找到目标。

基本上,逼近器的工作方式如下,您输入 2 个特征:位置和速度以及 one-hot 编码中的 3 个动作之一:0 -> [1,0,0], 1 -> [0,1, 0] 和 2 -> [0,0,1]。输出是一个特定动作的动作值近似 Q_approx(s,a)。

我知道通常情况下,输入是状态(2 个特征),输出层包含每个动作的 1 个输出。我看到的最大区别是我已经运行了 3 次前馈传递(每个动作一次)并取最大值,而在标准实现中运行一次并取最大值超过输出。

也许我的实现完全错误,我想错了。将代码粘贴在这里,它是一团糟,但我只是试验了一下:

提前致谢!

0 投票
0 回答
893 浏览

python - 在 Python (v0) 中为 OpenAi CartPole 实现 Q 学习

-------------------------------------------------- - - - - - - 更新 - - - - - - - - - - - - - - - - - - - -------------------- 我继续尝试通过更改参数和通过学习规则更新的方式来改进代码。我想现在的表现是一个但更好,但仍然比预期的差得多。我希望继续尝试通过 Q learning 来解决它,因为这个网站引用了一个用 Q learning 解决的 cartpole 问题的例子:https ://medium.com/@tuzzer/cart-pole-balancing-with-q-learning- b54c6068d947

我的新代码:

-------------------------------------------------- ----原帖----------------------------- ---------- 我是强化学习的初学者,刚刚开始学习它。我正在尝试实施 Q 学习来解决 OpenAi 健身房的 CartPole 问题。我似乎没有得到好的结果,我的程序似乎也没有改善它的发挥。我该如何努力改进它?

编码:

0 投票
1 回答
543 浏览

keras - Keras输入暗淡错误

虽然我正在尝试 Openai 的 keras 和 Gym,但我不断收到此错误

我收集我的数据如下:

我的 x 数组将如下所示:

我的 Y:

网络代码:

但是我无论如何都不能在 Keras 中喂它。如果有人可以帮助我解决它,那就太好了,谢谢!

0 投票
1 回答
555 浏览

python - 无法使用 pip install -e 安装 openai Universe?

当我遵循公司提供的安装规则时,我收到了这个错误。这是安装[链接]:(https://github.com/openai/universe#installation

显示此错误:

0 投票
1 回答
102 浏览

python - 运行健身房时,健全性检查返回 numpy __version__ 的属性错误

我正在尝试让开放式 AI 健身房正常工作,但我面临着一个非常持久的错误。
当我运行我的程序(只是简单的演示 cartpole 求解器)时,我收到了这个错误。(文件“gperm.py”是cartpole求解器)

最后打印:

这很奇怪,因为我对 numpy 进行了完整的 pip 安装,甚至尝试 git clone 它也没有用。我已经检查以确保我没有其他名为 numpy 的文件,并且一切似乎都在检查中。

如果其他人遇到同样的问题或任何人有解决方案,将不胜感激。

它还会打印一个“提示”,提示我尝试:pip install -U numpy。

我确实有一个 numpy>= 1.10.4 的版本,所以它不应该弹出对吗?(不记得确切的版本)

但是,使用 pip install -U numpy 会返回“SNIMissingWarning”、“InsequrePlatformWarning”和以下内容:

老实说,我不知道那告诉我要做什么,因为我确实拥有这些目录的权限。

0 投票
1 回答
477 浏览

python - OpenAI 无法启动程序

每当我尝试在 Universe 上运行程序时,都会在套接字关闭的地方收到此错误。我不知道如何解决它,而且我已经搞砸了很多年。我正在使用 openAI 提供的示例代码,但由于某种原因,Flash 游戏没有按预期加载。有什么建议么?

顺便说一下,我正在关注https://github.com/openai/universe给出的 python 代码。这是:

这是我尝试运行它时得到的错误日志。我不完全确定出了什么问题以及如何解决它。

0 投票
1 回答
1055 浏览

python - Open AI Gym Cartpole 的策略梯度方法

我是强化学习的初学者,我正在尝试实施策略梯度方法来使用 Tensorflow 解决 Open AI Gym CartPole 任务。但是,我的代码似乎运行得非常缓慢;第一集以可接受的速度运行,而从第二集开始就非常慢。为什么会出现这种情况,我该如何解决这个问题?

我的代码:

任何帮助是极大的赞赏。

0 投票
1 回答
2419 浏览

python - 兑换到 numpy.ndarray

我对 python 有点陌生,我正在使用 OpenAI 的 miniWOB。我想用 cv2 打印出我对代理的观察。但真的无所谓。我的问题是我不知道我从健身房收到的用于“观察”的确切数据类型。但我希望它是一个简单的 3Dimensional numpy 数组。这种格式我可以使用 cv2 打印出来。那么任何人都可以帮我将我的 <class 'list> 观察结果转换为:<type nunpy.ndarray> 吗?我已经尝试过观察 = np.asarray(observation) 但后来我收到了这个错误:“mat data type = 17”。

我收到这个:

我想将其转换为这种类型: