同一物体有不同的图片。图片是从不同的角度拍摄的,所以虽然图片上的对象是一样的,但图片本身可能会有很大的不同。
是否有一个示例或准备使用深度学习模型,该模型将为同一对象的不同图片生成相似/接近的向量?(似乎人脸检测的工作方式有点类似......)
同一物体有不同的图片。图片是从不同的角度拍摄的,所以虽然图片上的对象是一样的,但图片本身可能会有很大的不同。
是否有一个示例或准备使用深度学习模型,该模型将为同一对象的不同图片生成相似/接近的向量?(似乎人脸检测的工作方式有点类似......)
您正在寻找的是一个连体网络,其中您将 2 张图像通过同一个网络并尝试最大化不同图像之间的距离并最小化相似图像之间的距离。另一种变体使用三个图像而不是两个,其中一个充当锚点,另外两个与原始图像属于同一类,另一个属于不同类,您尝试分别最小化和最大化与锚点的距离。实现这一点的损失函数是对比损失函数。在这里寻找对比损失的实现。你可以在这样的设置中使用任何标准架构,我个人发现 VGG-16 易于调整和简单。
这里有一些你应该看的论文来理解它们背后的数学和理论