问题标签 [trains]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
187 浏览

python - 有没有办法使用 TRAINS python 包创建一个比较超参数与模型精度的图表?

我想运行多个实验,然后报告每个实验的模型准确性。

我正在使用 pytorch (v1.1.0) 训练一个玩具 MNIST 示例,但目标是,一旦我可以比较玩具问题的性能,就可以将其与实际代码库集成。

据我了解 TRAINS python 包,使用“两行代码”,我的所有超参数都已记录(在我的情况下为命令行 argparse)。

我需要做什么才能报告最终标量,然后能够对所有不同的训练实验(w/超参数)进行排序,以找到最好的。

我想要得到的是一个图表,在 X 轴上我有超参数值,在 Y 轴上我有验证准确度。

0 投票
1 回答
150 浏览

python - 如何使用 TRAINS python 自动魔法实验管理器手动注册 sci-kit 模型?

我主要使用 scikit-learn,据我了解,TRAINS 自动魔术不会自动捕获 scikit-learn 模型存储/加载。

在“腌制”后如何手动注册模型。

例如:

0 投票
1 回答
2686 浏览

kubernetes - 从 AMI 移动到本地机器时如何备份/恢复 TRAINS 服务器

我最近开始使用 TRAINS,服务器位于 AWS AMI 中。我们目前使用的是 v0.9.0。

我想移动 TRAINS 服务器以在我们的本地 kubernetes 集群上运行。但是,我不想丢失 AWS 中当前服务器上的数据(实验、模型、登录等)。有没有办法备份当前服务器并将其恢复到本地服务器?

谢谢!

0 投票
2 回答
106 浏览

python - 带网格搜索的火车

我想在网格搜索期间测试火车的使用情况,但不清楚如何做。

在演示服务器中创建一个实验并记录所有内容,但无论“task_name”和

可以用不同的“task_name”调用,但不会将任何数据记录到服务器中,只创建“草稿”。

这是一个示例代码:

我最后的尝试是:

它记录了实验选项卡下的所有信息,而“草稿”下没有记录。在过去的两个小时里,我尝试阅读提供的一些文档并阅读源代码,但没有运气。

有什么帮助吗?

0 投票
1 回答
52 浏览

python - 火车中的平行坐标图

有没有办法在 TRAINS ( https://github.com/allegroai/trains ) 包中创建平行坐标图来比较几个超参数与特定指标的关系?

0 投票
2 回答
84 浏览

trains - 使用 Trains 跟踪单独的训练/测试过程

在我的设置中,我运行一个脚本来训练模型并开始生成检查点。另一个脚本监视新的检查点并评估它们。脚本并行运行,因此评估只是训练的一个步骤。

支持这种情况的正确轨道配置是什么?

0 投票
1 回答
78 浏览

trains - 是否可以动态指定 Trains 配置文件或相对于运行脚本路径?

假设我有一个服务器,许多用户在其中运行不同的实验,可能使用不同的 Trains 服务器。

我知道TRAINS_CONFIG_FILE环境变量,但我想知道是否可以通过以下方式之一使其更加灵活:

  1. 动态指定 Trains 配置文件,即在训练脚本运行期间?
  2. 在每个训练存储库中存储一个配置文件并指定其相对于运行脚本路径的路径(而不是相对于~/)?
0 投票
1 回答
24 浏览

trains - 克隆实验是否适用于 sklearn 函数?

我正在尝试运行一个脚本,并且在 allegro.ai 中克隆实验时不断得到这个 AttributeError: 'Namespace' object has no attribute 'get' 有人可以帮忙吗?

0 投票
1 回答
141 浏览

trains - 火车:我可以重置任务的状态吗?(从“中止”回到“正在运行”)

我不得不在中间停止训练,这将 Trains 状态设置为Aborted。后来我从最后一个检查点继续它,但状态仍然存在Aborted。此外,自动训练指标不再出现在仪表板中(尽管自定义指标仍然存在)。

我可以将状态重置回Running并再次让 Trains 记录训练统计信息吗?

编辑:Task.get_task()继续训练时,我使用and not检索了任务Task.init()。也许这就是训练数据不再更新的原因?

Edit2:我也试过Task.init(reuse_last_task_id=original_task_id_string)了,但它只是创建了一个新任务,并没有重用给定的任务 ID。

0 投票
1 回答
43 浏览

trains - 向 Trains 服务器报告的弹性如何?

在以下情况下,Trains 将如何将任何丢失的数据发送到服务器?

  • 运行实验时 Internet 连接暂时中断
  • 互联网连接中断并且在实验结束前没有恢复(任何手动方式发送所有丢失的数据?)
  • 运行 Trains 服务器的机器在实验过程中重置