我正在使用 Pytorch Lightning 来训练我的模型(在 GPU 设备上,使用 DDP),TensorBoard 是 Lightning 使用的默认记录器。
我的代码设置为分别记录每个训练和验证步骤的训练和验证损失。
class MyLightningModel(pl.LightningModule):
def training_step(self, batch):
x, labels = batch
out = self(x)
loss = F.mse_loss(out, labels)
self.log("train_loss", loss)
return loss
def validation_step(self, batch):
x, labels = batch
out = self(x)
loss = F.mse_loss(out, labels)
self.log("val_loss", loss)
return loss
TensorBoard 在选项卡中正确绘制train_loss
和val_loss
图表SCALERS
。但是,在HPARAMS
左侧栏中的选项卡中,仅hp_metric
在 下可见Metrics
。
但是,在HPARAMS
左侧栏中的选项卡中,仅hp_metric
在 下可见Metrics
。
我们如何添加train_loss
和val_loss
到该Metrics
部分?这样,我们将能够使用val_loss
inPARALLEL COORDINATES VIEW
而不是hp_metric
。
使用 Pytorch 1.8.1、Pytorch Lightning 1.2.6、TensorBoard 2.4.1