我正在尝试进行图像分割,并且了解了 DeepLabv3 的 Google 工作。
这是对论文的参考: https ://arxiv.org/abs/1706.05587
Chen, LC, Papandreou, G., Schroff, F. 和 Adam, H.,2017。重新思考用于语义图像分割的空洞卷积。arXiv 预印本 arXiv:1706.05587。
该架构经过训练可以对 Pascal VOC 2012 数据集的 20+1 个类别(20 个前景和 1 个背景类别)进行分割。
Pytorch 在 Pascal 数据集上提供了预训练的 deeplabv3,我想在城市景观上训练相同的架构。因此,Pascal VOC 数据集有不同的类别。我想知道有效的方法是什么?
目前这是我写的唯一代码:
import torch
model = torch.hub.load('pytorch/vision:v0.6.0', 'deeplabv3_resnet101', pretrained=True)
model.eval()