2

我使用 libSVM 创建了一个多类 SVM 模型来对图像进行分类。我使用网格搜索优化了 C 和 G 参数并使用了 RBF 内核。

这些类是 1)动物 2)花卉 3)风景 4)肖像。

我的训练集是每个类别的 100 个图像,对于每个图像,我使用 Lear 的 Gist Descriptor C 代码提取了一个 920 长度的向量:http: //lear.inrialpes.fr/software

在 50 个图像/类别上测试我的模型后,我达到了大约 50% 的准确度,这是随机的两倍(25%,因为有四个类别)。

我对计算机视觉比较陌生,但熟悉机器学习技术。有关如何有效提高准确性的任何建议?

非常感谢,期待您的回复!

4

1 回答 1

0

这是非常非常非常开放的研究挑战。并且不一定有一个单一的答案在理论上可以保证更好。

鉴于您的类别,这并不是一个糟糕的开始,但请记住,Gist 最初被设计为场景分类的全局描述符(尽管经验证明它对其他图像类别有用)。在表示方面,我建议尝试基于颜色的特征,如基于补丁的直方图,以及流行的低级梯度特征,如 SIFT。如果您刚刚开始学习计算机视觉,那么我会说 SVM 对于您正在做的事情来说已经足够了,这取决于您的图像集的可变性,例如照明、视角、焦点等。

于 2013-06-25T15:52:47.353 回答