1

我在同一位置拍摄了 20 张心脏图像,其中有 50 张。所以,20 个图像是一个输入,我有 50 个输入。因为心是动的,所以所有的形象都是不同的。我想将这些图像作为输入,然后使用深度学习将二进制掩码图像分割为输出。

我将我的输入视为 3D,并在网上找到了很多 3D CNN 或 FCN。但这些是 x,y,z 3D 的情况。我的情况是 x,y,t。

有什么建议吗?

4

1 回答 1

1

这个问题类似于视频对象分割,其中需要利用跨帧的时间信息对视频中的多个帧进行语义分割。在您的情况下,可以将每组输入图像视为具有20 帧的视频,其中包含50 个视频的数据集,您可以使用监督、半监督或无监督的视频对象分割模型(取决于获得地面实况的可用性/成本面具)。这个公式解决了(x,y,t)使用 FCN 按顺序分割输入图像堆栈的任务。

以下是我为与视频对象分割相关的研究工作找到的参考资料:

于 2019-12-29T16:30:50.040 回答