9

所以我正在尝试使用以下方法加载模型:

learn = create_cnn(data, models.resnet50, lin_ftrs=[2048], metrics=accuracy) 
learn.clip_grad();
learn.load(f'{name}-stage-2.1')

但我收到以下错误

RuntimeError: Error(s) in loading state_dict for Sequential:
size mismatch for 1.8.weight: copying a param with shape torch.Size([5004, 2048]) from checkpoint, the shape in current model is torch.Size([4542, 2048]).
size mismatch for 1.8.bias: copying a param with shape torch.Size([5004]) from checkpoint, the shape in current model is torch.Size([4542]).

唯一不同的是我添加了一个stage-2.1模型中不存在的随机验证拆分,当我删除拆分并且没有验证集时,因为stage-2.1训练一切顺利。

发生了什么?

4

2 回答 2

4

使用cnn_learner方法和最新Pytorch与最新FastAI。有一个breaking change不连续的,所以你现在受苦了。

fastai 网站有很多例子,例如this one.

learn = cnn_learner(data, models.resnet50, metrics=accuracy)
于 2019-05-21T15:07:44.120 回答
2

实际上你的 torch.Size([5004, 2048]) 来自检查点,当前模型中的形状是 torch.Size([4542, 2048]) 你必须改变它。

于 2019-03-22T11:17:10.580 回答