0

我想分割仅占整个数据集一小部分的对象(例如 ICDAR 2015 或 CamVid 中的人)。像素级正负样本的比例约为1:200。

我的网络,其主干是预训练的 VGG16 或 ResNet50,可以在具有 12 个类的 CamVid 数据集中运行良好。然而,当我微调这个网络以在 CamVid 中只分割人时,损失将保持在 0.31 左右,并且即使学习率非常小(如 1e-5)也永远不会减少。更重要的是,在另一个数据集(ICDAR 2015)上训练新模型以获取图像中的文本区域时,我遇到了同样的问题。

我用pytorch构建了我的模型,我使用的损失函数是加权交叉熵损失。

谁能告诉我问题出在哪里?是关于损失函数的吗?因为我认为模型架构没有问题。非常感谢您的任何建议。

4

1 回答 1

0

对于 CamVid 数据集,人的类别太难用我的网络进行分割。对于 ICDAR 2015,我认为我的处理中存在一些问题(如随机裁剪)。最后,数据集真的很重要,我们应该更加关注它。

于 2017-12-29T01:59:23.077 回答