我正在使用 resnet50 对 pytorch 进行微调,并希望将最后一个全连接层的学习率设置为 10^-3,而其他层的学习率设置为 10^-6。我知道我可以按照其文档中的方法进行操作:
optim.SGD([{'params': model.base.parameters()},
{'params': model.classifier.parameters(), 'lr': 1e-3}],
lr=1e-2, momentum=0.9)
但是无论如何我不需要逐层设置参数