3

我已经开始大量使用计算机视觉技术,主要是深度学习,但我想尝试更好地理解更传统的技术以及良好的基础。我一直在使用一些手动特征工程技术来使用 RF 和 SVM 分类器进行分类。我研究了诸如 HOG 和 LBP 描述符之类的纹理表示,以及边缘滤波器、gabor 滤波器和诸如傅立叶描述符之类的空间特征。我有点缺乏的是对不同特征如何分组以及它们各自属于什么类别的好主意。我知道有些被定义为全局和本地,但这到底是什么意思,哪些是?还有我应该考虑的其他类别,如纹理和几何?任何解释都是有用的,非常感谢(我'

谢谢!

4

1 回答 1

3

特征是从图像中提取的以数值表示的信息,人类难以理解和关联。假设我们将图像视为数据,从数据中提取的信息称为特征。通常,从图像中提取的特征比原始图像的维度要低得多。维度的减少减少了处理一堆图像的开销。

基本上有两种类型的特征是根据应用程序从图像中提取的。它们是局部和全局特征。特征有时被称为描述符。全局描述符通常用于图像检索、对象检测和分类,而局部描述符则用于对象识别/识别。检测和识别有很大的区别。检测是发现某物/对象的存在(确定图像/视频中是否存在对象),而识别是发现对象的身份(识别人/对象)。

全局特征描述图像作为一个整体来概括整个对象,而局部特征描述对象的图像块(图像中的关键点)。全局特征包括轮廓表示、形状描述符和纹理特征,局部特征表示图像块中的纹理。形状矩阵、不变矩 (Hu, Zerinke)、直方图定向梯度 (HOG) 和 Co-HOG 是全局描述符的一些示例。SIFT、SURF、LBP、BRISK、MSER 和 FREAK 是局部描述符的一些示例。

通常,对于对象检测和分类等低级应用,使用全局特征,而对于对象识别等高级应用,则使用局部特征。全局和局部特征的结合提高了识别的准确性,同时也带来了计算开销的副作用。

于 2020-01-11T20:51:55.703 回答