我正在编写一个用于深度估计的连体网络。这意味着 2 个输入 RGB 图像(左和右),用于视差图生成的自动编码器,然后是用于将视差图与输入图像一起转换的空间变换器网络。
该变换的输出是一个新图像,然后用于最小化该特定图像与输入图像之间的重建误差。
有没有办法在 Tensorflow / Keras 中实现这一点?问题是自动编码器只是简单的层集,但是空间变换器呢?
这是更好地可视化问题的架构。
我正在编写一个用于深度估计的连体网络。这意味着 2 个输入 RGB 图像(左和右),用于视差图生成的自动编码器,然后是用于将视差图与输入图像一起转换的空间变换器网络。
该变换的输出是一个新图像,然后用于最小化该特定图像与输入图像之间的重建误差。
有没有办法在 Tensorflow / Keras 中实现这一点?问题是自动编码器只是简单的层集,但是空间变换器呢?
这是更好地可视化问题的架构。