我是计算机视觉的新手,现在正在做一个关于形状检测的学习项目,我在所有最有可能出现对象的图像中都有一个固定的感兴趣区域 (ROI),我必须比较它们的形状以确定是否两个输入图像中存在的对象是否相同。有轻微的平移和尺度变化以及光照变化。
我正在尝试比较两个输入图像之间对象的形状,并尝试提供描述它们相似性的输出值。如果相似度高于某个阈值,我可以判断两个输入图像中都存在同一个对象。
我已经尝试过轮廓,但它没有给出可靠的结果(阈值要么给出太多细节,要么错过一些重要细节)并且不能很好地概括所有图像。我正在考虑使用像 HOG 这样的全局形状描述符。
但是我在理解 HOG 描述符中的特征向量值时遇到了问题。如何在不使用 SVM 或机器学习的情况下比较两个输入图像的 HOG 特征向量(1D)以找到相似性?比较 HOG 特征向量的最佳方法是什么?
我不明白距离测量如何用于比较未来的向量。我想了解如何使用距离来比较特征向量和直方图的物理意义?如何使用它们来比较 HOG 特征向量?