“openai-gym”的相关标签问题

0 投票

1 回答

221 浏览

python - 无法禁用 FCEUX 2.2.2 的 GUI

我正在尝试在没有图形渲染的情况下在 AWS 上运行 FCEUX 模拟器，以便我的机器学习算法可以更快地训练。到目前为止，我已经尝试使用以下命令从命令行运行 FCEUX：

第一行编译并运行 rom，但模拟器的 GUI 仍然显示。

第二行给出了错误

目前我使用的是 Ubuntu 16.04、Python 2.7 和 FCEUX 2.2.2。任何帮助表示赞赏。

2017-08-13T21:22:28.447

0 投票

1 回答

2066 浏览

c++ - Mujoco 入门步骤：缺少 Simulate.cpp 的共享库

我正在尝试从 ubuntu 17.04（最新版本）安装 Mujoco（没有成功）。

说明网站：入门

版本：mjpro150 linux 和/或 mjpro140 linux

我已经有执照了。

按照以下步骤：

将带有激活密钥的 mjkey.txt 放在 bin = ok 上

运行模拟.cpp =错误

情况：

小路

Mujoco的命令步骤和错误

试图编译？！（从入门开始）

问题：有人知道我如何进行吗？

c++bash shared-libraries bin openai-gym

2017-08-14T07:06:20.103

0 投票

1 回答

276 浏览

reinforcement-learning - 函数逼近器和 q 学习

我正在尝试使用动作值近似函数来实现 q-learning。我正在使用 openai-gym 和“MountainCar-v0”环境来测试我的算法。我的问题是，它根本没有收敛或找到目标。

基本上，逼近器的工作方式如下，您输入 2 个特征：位置和速度以及 one-hot 编码中的 3 个动作之一：0 -> [1,0,0], 1 -> [0,1, 0] 和 2 -> [0,0,1]。输出是一个特定动作的动作值近似 Q_approx(s,a)。

我知道通常情况下，输入是状态（2 个特征），输出层包含每个动作的 1 个输出。我看到的最大区别是我已经运行了 3 次前馈传递（每个动作一次）并取最大值，而在标准实现中运行一次并取最大值超过输出。

也许我的实现完全错误，我想错了。将代码粘贴在这里，它是一团糟，但我只是试验了一下：

提前致谢！

reinforcement-learning openai-gym

2017-08-25T17:07:52.793

0 投票

0 回答

893 浏览

python - 在 Python (v0) 中为 OpenAi CartPole 实现 Q 学习

-------------------------------------------------- - - - - - - 更新 - - - - - - - - - - - - - - - - - - - -------------------- 我继续尝试通过更改参数和通过学习规则更新的方式来改进代码。我想现在的表现是一个但更好，但仍然比预期的差得多。我希望继续尝试通过 Q learning 来解决它，因为这个网站引用了一个用 Q learning 解决的 cartpole 问题的例子：https ://medium.com/@tuzzer/cart-pole-balancing-with-q-learning- b54c6068d947

我的新代码：

-------------------------------------------------- ----原帖----------------------------- ---------- 我是强化学习的初学者，刚刚开始学习它。我正在尝试实施 Q 学习来解决 OpenAi 健身房的 CartPole 问题。我似乎没有得到好的结果，我的程序似乎也没有改善它的发挥。我该如何努力改进它？

编码：

python machine-learning artificial-intelligence reinforcement-learning openai-gym

2017-08-26T21:03:04.263

0 投票

1 回答

543 浏览

keras - Keras输入暗淡错误

虽然我正在尝试 Openai 的 keras 和 Gym，但我不断收到此错误

我收集我的数据如下：

我的 x 数组将如下所示：

我的 Y：

网络代码：

但是我无论如何都不能在 Keras 中喂它。如果有人可以帮助我解决它，那就太好了，谢谢！

keras openai-gym

2017-09-04T22:26:21.327

0 投票

1 回答

555 浏览

python - 无法使用 pip install -e 安装 openai Universe？

当我遵循公司提供的安装规则时，我收到了这个错误。这是安装[链接]：（https://github.com/openai/universe#installation）

显示此错误：

python pip openai-gym

2017-09-21T12:10:21.083

0 投票

1 回答

102 浏览

python - 运行健身房时，健全性检查返回 numpy version 的属性错误

我正在尝试让开放式 AI 健身房正常工作，但我面临着一个非常持久的错误。
当我运行我的程序（只是简单的演示 cartpole 求解器）时，我收到了这个错误。（文件“gperm.py”是cartpole求解器）

最后打印：

这很奇怪，因为我对 numpy 进行了完整的 pip 安装，甚至尝试 git clone 它也没有用。我已经检查以确保我没有其他名为 numpy 的文件，并且一切似乎都在检查中。

如果其他人遇到同样的问题或任何人有解决方案，将不胜感激。

它还会打印一个“提示”，提示我尝试：pip install -U numpy。

我确实有一个 numpy>= 1.10.4 的版本，所以它不应该弹出对吗？（不记得确切的版本）

但是，使用 pip install -U numpy 会返回“SNIMissingWarning”、“InsequrePlatformWarning”和以下内容：

老实说，我不知道那告诉我要做什么，因为我确实拥有这些目录的权限。

python numpy openai-gym

2017-09-24T11:04:14.843

0 投票

1 回答

477 浏览

python - OpenAI 无法启动程序

每当我尝试在 Universe 上运行程序时，都会在套接字关闭的地方收到此错误。我不知道如何解决它，而且我已经搞砸了很多年。我正在使用 openAI 提供的示例代码，但由于某种原因，Flash 游戏没有按预期加载。有什么建议么？

顺便说一下，我正在关注https://github.com/openai/universe给出的 python 代码。这是：

这是我尝试运行它时得到的错误日志。我不完全确定出了什么问题以及如何解决它。

python sockets openai-gym

2017-10-04T14:15:57.520

0 投票

1 回答

1055 浏览

python - Open AI Gym Cartpole 的策略梯度方法

我是强化学习的初学者，我正在尝试实施策略梯度方法来使用 Tensorflow 解决 Open AI Gym CartPole 任务。但是，我的代码似乎运行得非常缓慢；第一集以可接受的速度运行，而从第二集开始就非常慢。为什么会出现这种情况，我该如何解决这个问题？

我的代码：

任何帮助是极大的赞赏。

python machine-learning tensorflow reinforcement-learning openai-gym

2017-10-06T03:25:57.277

0 投票

1 回答

2419 浏览

python - 兑换到 numpy.ndarray

我对 python 有点陌生，我正在使用 OpenAI 的 miniWOB。我想用 cv2 打印出我对代理的观察。但真的无所谓。我的问题是我不知道我从健身房收到的用于“观察”的确切数据类型。但我希望它是一个简单的 3Dimensional numpy 数组。这种格式我可以使用 cv2 打印出来。那么任何人都可以帮我将我的 <class 'list> 观察结果转换为：<type nunpy.ndarray> 吗？我已经尝试过观察 = np.asarray(observation) 但后来我收到了这个错误：“mat data type = 17”。

我收到这个：

我想将其转换为这种类型：

python opencv numpy openai-gym

2017-10-10T09:10:18.547

问题标签 [openai-gym]

Reference