问题标签 [ml-agent]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 从 Tensorflow 中的 Unity ml-agents 推断预训练的 ONNX 模型
我有一个来自 Unity 的 ml-agents 的预训练模型。现在我正在尝试使用 TensorFlow 在 python 中对该模型进行推理。为此,我使用TensorFlow Backend for ONNX将 ONNX 模型保存为 SavedModel,以便稍后加载此模型。用于保存模型的代码是
加载模型和运行测试示例的代码
现在有几个问题。
- 测试的输出有 6 个输出值。(有关 ONNX 文件的可视化图表,请参见下图)
- 尝试保存模型时收到以下消息(请参阅下面的调试信息)
unity3d - ML-Agents 版本号
我对 Unity 使用的版本编号感到非常困惑。查看 GitHub,我看到最新版本被称为“第 17 版”,但在包管理器中查看时的版本号看起来像 1.08。
版本 17 是否与 1.08 相同?有人可以澄清一下。
另外,我下载了 Release 17 并通过引用 package.json 文件安装了它,但是 Unity 将其显示为 2.0.0
我希望你们能提供帮助。
谢谢
c# - 构建项目后可以通过 ML-Agent 学习吗?
我正在尝试制作基于 ML-Agent 的游戏。
该游戏的目标是找到解决问题的最佳奖励价值。
游戏开始时,玩家标记被放置在迷宫中。
玩家不能直接移动标记,只能设置奖励值(超时,移动,到达目标......)。
设置奖励后,玩家通过 ML-Agent 重复训练,竞相寻找最佳模型。
顺便说一句,通过 ML-Agent 学习在 Unity Editor 中效果很好,
但是在构建项目的应用程序中,我无法运行学习。
我的问题是:是否可以通过ML-Agent在应用程序中学习构建项目?
感谢阅读。
tensorflow - 无法在 Unity 的旧版 ML 代理上使用经过训练的模型
我正在使用旧的 Unity 项目进行培训,但遇到了几个问题:
- 我能够进行培训并生成
.nn
文件,但是每当我将文件放入大脑时,它都会显示错误消息,上面写着argumentexception off-axis dimensions must match
.
Unity 控制台中显示以下内容:
- 我尝试训练“球平衡”示例并且也能够进行训练部分,但是当 python 尝试将
.pb
文件转换为.nn
文件时发生错误。(.nn
示例提供的文件虽然工作得很好)
我正在使用 Unity 2018.3.11 和 ML-agent 0.8.1
我已添加ENABLE_BARRACUDA
到我的项目设置中,但它似乎不起作用。
validation - 如何对强化学习项目进行有效性测试?
我想知道如何为强化学习项目进行有效性测试。我已经完成了关于使用 Unity ML-Agents 强化学习的本科论文,并在一次会议上提交了我的工作。一位审稿人说需要进行有效性测试。但我不知道如何对 RL 进行有效性测试,因为我没有使用任何数据集。我的项目是“使用强化学习和模仿学习算法的角色动画”,其中我使用 Unity ML-Agents 训练人形角色使用 RL 算法、PPO(近端策略优化)和 IL 算法 GAIL(生成对抗模仿学习)和 BC(行为克隆)。
unity3d - 如何使用 ml-agent 构建项目?
我在当前的 Unity 项目中使用 ML-Agents 教授神经网络。但现在我无法理解如何构建我的游戏。我使用 17 版本。
我用谷歌搜索了它,但示例和教程适用于非常旧的版本。
python - 机器学习代理合作推送块不返回奖励
我正在使用最新的合作推送块环境(https://github.com/Unity-Technologi...nvironment-Examples.md#cooperative-push-block)(导出以使用 Python API)稳定版。问题是我没有得到奖励(正面或负面)。它始终为 0。如果我导出单推块环境,我会正确收到奖励。下面是我在协作示例https://github.com/Unity-Technologies/ml-agents/blob/main/docs/Python-API.md中使用的代码
根据文档,我应该收到负惩罚 (-0.0001) 或正信号 +1、+2、+3。即使他们随机推送一个块,我也会收到 0 作为奖励。
他们在文档中说奖励是作为“团体奖励”给予的。我不知道这是否意味着对上述代码的更改。
python - 关于使用 Unity:ML-Agents 和 DQN 算法
通过连接外部 API 和我创建的统一环境,我很难学习。
我正在查看以前的 ml-agent 版本的 DQN 代码,并想使用以下代码。我应该如何在当前版本中使用它?
和
像这样。
我在看官方纪录片的时候正在尝试将其更改为当前版本,但没有明确解决。
我应该如何在当前的 ml-agents 版本中使用它?这到底是什么意思?我的意思是,为什么这会成为环境的“状态”?
下面的代码是看了官方纪录片后写的,但不知道这样对不对,也不知道是什么意思。
ml-agent - 设置 ML-Agents 推理种子
我想知道是否有办法在运行推理时设置 ML-Agent 的“种子”。运行时,我的代理每次运行时都会以完全相同的方式重复相同的操作(在推理模式下)。有没有办法改变种子,让它每次都给出不同的结果?提前致谢!