我为自定义超参数搜索训练了具有不同配置的多个模型。我使用 pytorch_lightning 及其日志记录(TensorboardLogger)。在 Task.init() 之后运行我的训练脚本时,ClearML 会自动创建一个任务并将记录器输出连接到服务器。
我记录每个应变阶段train
,val
以及test
每个时期的以下标量loss
:acc
和iou
当我有多个配置时,例如networkA
,networkB
第一个训练将其值记录到loss
,acc
和iou
,但第二个记录到networkB:loss
,networkB:acc
和networkB:iou
。这使得价值观无法比较。
我的任务初始化训练循环如下所示:
names = ['networkA', networkB']
for name in names:
task = Task.init(project_name="NetworkProject", task_name=name)
pl_train(name)
task.close()
方法 pl_train 是使用 Pytorch Ligtning 进行整个训练的包装器。此方法中没有 ClearML 代码。
您是否有任何提示,如何使用完全分离的任务在脚本中正确使用循环?
编辑:ClearML 版本是 0.17.4。问题已在主分支中修复。