79

我正在开发一个图像处理项目,并且在许多科学论文中遇到了遮挡这个词,遮挡在图像处理的上下文中是什么意思?字典只是给出一个笼统的定义。任何人都可以使用图像作为上下文来描述它们吗?

4

5 回答 5

127

遮挡意味着您想看到某些东西,但由于传感器设置的某些属性或某些事件而无法看到。它的具体表现方式或您处理问题的方式会因手头的问题而异。

一些例子:

如果您正在开发一个跟踪对象(人、汽车等)的系统,那么如果您正在跟踪的对象被另一个对象隐藏(遮挡),就会发生遮挡。就像两个人从彼此身边走过,或者一辆在桥下行驶的汽车。这种情况下的问题是当一个对象消失并再次出现时你会做什么。

如果您使用的是测距相机,那么遮挡是您没有任何信息的区域。一些激光测距相机的工作原理是将激光束传输到您正在检查的表面上,然后设置一个相机设置来识别该激光在结果图像中的撞击点。这给出了该点的 3D 坐标。然而,由于相机和激光不一定对齐,因此在检查表面上可能会有相机可以看到但激光无法击中的点(遮挡)。这里的问题更多是传感器设置问题。

如果场景的某些部分只能被两个摄像机之一看到,那么在立体成像中也会发生同样的情况。显然无法从这些点收集范围数据。

应该还有更多的例子。

如果您指定您的问题,那么也许我们可以定义在这种情况下什么是遮挡,以及它会带来什么问题

于 2010-05-04T10:55:20.043 回答
30

遮挡问题是计算机视觉普遍困难的主要原因之一。具体来说,这在Object Tracking中问题更大。见下图:

在此处输入图像描述

请注意,女士的脸在框架中是如何不完全可见0519的,0835而不是在框架中的脸0005


这是另外一张照片,其中男人的脸部分隐藏在所有三个框架中。

部分遮挡


请注意,在下图中,红色和绿色边界框中的情侣如何由于遮挡(即部分被他们前面的另一个人隐藏)而在中间帧中丢失了跟踪,但当他们变为(几乎) 完全可见。

在此处输入图像描述

图片提供:斯坦福大学,南加州大学

于 2017-04-24T16:01:06.143 回答
12

遮挡是阻碍我们视线的因素。在这里显示的图像中,我们可以很容易地看到前排的人。但是第二行是部分可见的,第三行是不可见的。在这里,我们说第二行被第一行部分遮挡,第三行被第一行和第二行遮挡。当有很多物体时,我们可以在教室(学生排成一排)、交通路口(等待信号的车辆)、森林(树木和植物)等中看到这样的遮挡。 在此处输入图像描述

于 2016-10-27T05:41:05.360 回答
5

除了已经说过的话,我想添加以下内容:

  • 对于对象跟踪,处理遮挡的一个重要部分是编写一个有效的成本函数,它将能够区分被遮挡的对象和正在遮挡它的对象。如果成本函数不正确,则对象实例(id)可能会交换并且对象将被错误地跟踪。成本函数的编写方式有很多种,有些方法使用 CNN [1],而有些方法更喜欢控制和聚合特征[2]。CNN 模型的缺点是,如果您正在跟踪训练集中的对象而存在不在训练集中的对象,并且第一个对象被遮挡,则跟踪器可能会锁定错误的对象,并且可能会或可能永远无法恢复。这是一个视频显示这一点。聚合特征的缺点是您必须手动设计成本函数,这可能需要时间,有时还需要高级数学知识。
  • 在密集立体视觉重建的情况下,当一个区域被左相机看到而右相机看不到时,就会发生遮挡(反之亦然)。在视差图中,这个被遮挡的区域显示为黑色(因为该区域中的相应像素在其他图像中没有等效像素)。一些技术使用所谓的背景填充算法,用来自背景的像素填充被遮挡的黑色区域。其他重建方法只是让那些没有值的像素在视差图中,因为来自背景填充方法的像素在这些区域可能不正确。波纹管您有使用密集立体方法获得的 3D 投影点。这些点向右旋转了一点(在 3D 空间中)。

    在此处输入图像描述

于 2020-03-11T21:06:54.020 回答
3

由于其他答案已经很好地解释了遮挡,我只会补充一点。基本上,我们和计算机之间存在语义鸿沟。

计算机实际上将每个图像视为 RGB 图像中每种颜色的值序列,通常在 0-255 范围内。对于图像中的每个点,这些值以 (row, col) 的形式进行索引。因此,如果对象在对象的某些方面隐藏的相机中改变其位置(不显示人的手),计算机将看到不同的数字(或边缘或任何其他特征),因此计算机算法将更改为检测、识别或跟踪对象。

于 2018-04-28T09:11:26.220 回答