image-processing - 提取图像属性

Question

我正在做一个计算机视觉项目，我需要一些帮助。我的项目的目标是提取任何对象的属性——例如，如果我有一只耐克跑鞋，我应该能够首先判断它是一只鞋，然后再判断它是一只耐克鞋而不是阿迪达斯鞋（可能是因为耐克勾号），然后弄清楚它是跑鞋而不是足球鞋钉。

我首先将其视为图像分类问题，我正在使用以下步骤：

我想知道我应该如何从这里开始？使用 D-SIFT 进行特征提取是否会帮助我识别属性，因为它仅代表某些点周围的梯度？

有时，我的分类会出错，例如，如果我用左鞋和手表的图像训练分类器，右鞋被分类为手表。我知道我必须在我的训练集中包含正确的鞋子来解决这个问题，但是我应该遵循其他方法吗？

还有什么方法可以理解形状吗？例如，如果我训练了手表分类器，并且训练集中有圆形和矩形表盘的手表，我可以识别任何新测试图像的形状吗？还是我只是为圆形和矩形表盘的手表单独训练？谢谢

0 回答 0