我已经阅读了几篇关于使用图形切割进行3D 重建的论文,我注意到似乎有两种替代方法可以解决这个问题。
一种方法是体积方法,它描述了体素的 3D 区域,图切割用于推断每个体素的二进制标记(包含或不包含感兴趣的对象)。采用这种方法的论文包括Multi-View Stereo via Volumetric Graph Cuts and Occlusion Robust Photo-Consistency和A Surface Reconstruction Using Global Graph Cut Optimization。
第二种方法是 2D 的,它试图用投影到那里的 3D 点的深度来标记参考图像的每个像素。采用这种方法的论文包括Computing Visual Correspondence with Occlusions via Graph Cuts。
我想了解每种方法的优点/缺点,以及在选择使用哪种方法时最重要的。到目前为止,我了解第一种方法的一些优点是:
- 这是一个二元问题,因此完全可以使用 Max-Flow 算法解决。
- 提供简单的遮挡建模方法。
第二种方法的一些优点是:
- 图的每个节点的较小邻居集。
- 更容易建模平滑度(但它会提供更好的结果吗?)。
此外,我会对选择一种或另一种表示方式更好的情况以及原因感兴趣。