我正在尝试使用 COCO 2014 数据在 PyTorch 中进行语义分割训练。我有一个带有交叉熵损失函数的 PSPNet 模型,该模型在 2012 年的 PASCAL VOC 数据集上完美运行。现在我正在尝试使用一部分 COCO 图片来执行相同的过程。但是 Coco 有 json 数据而不是 .png 图像用于注释,我不得不以某种方式将一个转换为另一个。我注意到 cocotools 中有 annToMask,但我无法安静地弄清楚如何在我的情况下使用该功能。这就是我的数据加载器的拉取项目的样子
def pull_item(self, index):
I DONT KNOW WHAT TO DO HERE
raw_img = self.transform(raw_img)
anns_img = self.transform(anns_img)
return raw_img, anns_img
下面是我使用来自数据加载器的数据的训练函数的样子。
for images, labels in dataloaders_dict[phase]:
images = images.to(device)
labels = torch.squeeze(labels)
labels = labels.to(device)
with torch.set_grad_enabled(phase == 'train'):
outputs = net(images)
loss = criterion(outputs, labels.long())