我正在寻找一种方法,给定输入图像和神经网络,它将为图像中的每个像素(天空、草、山、人、汽车等)输出一个标记类。
我已经设置了 Caffe(未来分支)并在 PASCAL-Context模型上成功运行了FCN-32s 全卷积语义分割。但是,我无法用它生成清晰的标记图像。
可视化我的问题的图像:
输入图像
基本事实
和我的结果:
这可能是一些分辨率问题。知道我要去哪里错了吗?
我正在寻找一种方法,给定输入图像和神经网络,它将为图像中的每个像素(天空、草、山、人、汽车等)输出一个标记类。
我已经设置了 Caffe(未来分支)并在 PASCAL-Context模型上成功运行了FCN-32s 全卷积语义分割。但是,我无法用它生成清晰的标记图像。
可视化我的问题的图像:
输入图像
基本事实
和我的结果:
这可能是一些分辨率问题。知道我要去哪里错了吗?
看起来 32s 模型正在取得长足进步,因此以粗略的分辨率工作。能不能试试8s 的机型,好像分辨率降低的比较少。
查看J Long、E Shelhamer、T Darrell用于语义分割的完全卷积网络,CVPR 2015(尤其是图 4),似乎 32s 模型不是为捕获分割的精细细节而设计的。