“semantic-segmentation”的相关标签问题

0 投票

2 回答

9886 浏览

image-segmentation - 用于pytorch中图像分割的通道方式CrossEntropyLoss

我正在做一个图像分割任务。总共有 7 个类，所以最终的输出是一个类似于 [batch, 7, height, width] 的张量，它是一个 softmax 输出。现在直观地我想使用 CrossEntropy 损失，但 pytorch 实现不适用于通道明智的 one-hot 编码向量

所以我打算自己做一个函数。在一些stackoverflow的帮助下，我的代码到目前为止看起来像这样

我得到两个错误。代码本身提到了一个，它需要一个热向量。第二个说如下

例如，我试图让它解决一个 3 类问题。所以目标和标签是（不包括简化的批处理参数！）

目标：

[[0 1 1 0 ] [0 0 0 1 ] [1 0 0 0 ] [0 0 1 1 ] [0 0 0 0 ] [1 1 0 0 ] [0 0 0 1 ] [0 0 0 0 ] [1 1 1 0 ] [0 0 0 0 ] [0 0 0 1 ] [1 1 1 0 ]

标签：

[[0 1 1 0 ] [0 0 0 1 ] [1 0 0 0 ] [0 0 1 1 ] [.2 0 0 0] [.8 1 0 0 ] [0 0 0 1 ] [0 0 0 0 ] [1 1 1 0 ] [0 0 0 0 ] [0 0 0 1 ] [1 1 1 0 ]

那么如何修复我的代码来计算通道明智的 CrossEntropy 损失？

2018-06-17T12:00:42.413

0 投票

1 回答

1964 浏览

python - 如何在 Keras 中保留最大索引来实现 SegNet

我正在尝试在 Keras（tf 后端）中实现 SegNet 来进行语义分割。

SgeNet 最令人印象深刻的技巧是将最大池索引传递给上采样层。但是，我在 github 上找到了许多 Keras 中的 SegNet 实现（例如），仅使用简单的 UpSampling（称为 SegNet-Basic）。

我注意到它可以在 Tensorflow 中使用“ tf.nn.max_pool_with_argmax ”来实现。所以我想知道是否有任何类似的方法来获取最大池索引并将它们放回 Keras 中的上采样中。

提前致谢。

python tensorflow keras deep-learning semantic-segmentation

2018-06-19T08:39:51.630

0 投票

0 回答

662 浏览

tensorflow - 如何改进 deeplabV3+ 的 miou？

目前，我正在努力使用在我自己的数据集上训练的deeplabV3+来改进语义分割问题的结果。我已经使用模型动物园中的不同预训练模型成功训练了 deeplabV3+几次，全部基于xception_65，但我的结果保持在相同的miou范围内，大约在这个区间[10, 11]附近。我只有一个具有 11GB GPU 内存的 GPU 可供使用。我的数据集有8 个类，对象大小从小到大不等，而且非常不平衡。以下是标签权重：[1, 4, 4, 17, 42, 36, 19, 20]。在我的数据集中，我有757个训练实例和100 个 验证。

训练时的一般趋势是：前 10k 次迭代我的损失减少了，但随后它只是振荡。
我试过了：

调整参数，例如：学习率、last_layer_gradient_multiplier、权重衰减
训练各种图像尺寸321、513、769
在这个公式中使用上述权重进行某种加权

权重 = tf.to_float(tf.equal(scaled_labels, 0)) * 1 + tf.to_float(tf.equal(scaled_labels, 1)) * 4 + tf.to_float(tf.equal(scaled_labels, 2)) * 4 + tf.to_float(tf.equal(scaled_labels, 3)) * 17 + tf.to_float(tf.equal(scaled_labels, 4)) * 42 + tf.to_float(tf.equal(scaled_labels, 5)) * 36 + tf. to_float(tf.equal(scaled_labels, 6)) * 19 + tf.to_float(tf.equal(scaled_labels, 7)) * 20 + tf.to_float(tf.equal(scaled_labels, ignore_label)) * 0.0

我在没有微调批量标准化参数（fine_tune_batch_norm = False）的情况下进行了训练。尽管我也尝试使用 321 裁剪大小训练这些参数（fine_tune_batch_norm = True），以便能够在我的 GPU中适应12的批量大小。

关键是我需要一些技巧来弄清楚我可以做些什么来改善这些结果。你们有什么感想？我需要更多数据来增加我的 miou 或硬件吗？

tensorflow deep-learning semantic-segmentation

2018-06-19T11:37:37.627

0 投票

1 回答

1377 浏览