0

如果您回答我的问题,我将不胜感激。我担心我做错了,因为我的网络总是给出没有任何分割的黑色图像。我正在做语义分割Caffe。的输出score layer是 <1 5 256 256> batch_size no_classes image_width image_height。它被发送到SoftmaxWithLoss层,损失层的输出是具有 5 个类别标签的真实图像 <1 1 256 256>。

我的问题是:损失层的这两个输入的维度不匹配。我应该为这 5 个类创建 5 个标签图像并将标签层中的 5 的 batch_size 发送到损失层吗?

如何为语义分割准备标签数据?

问候

4

1 回答 1

0

你的尺寸没问题。您每像素输出 5 个向量,表示每个类的概率。基本事实是单个标签(整数),损失鼓励正确标签的概率成为像素的最大值

于 2017-03-28T05:03:34.857 回答