4

我正在研究图像处理中的机器学习问题。我想通过使用定向梯度直方图 (HOG) 和支持向量机 (SVM) 来获取图像中对象的位置。我已经阅读了几篇关于训练 SVM 的文章和教程。设置非常标准。我已经标记了正训练图像,现在需要生成一组负训练样本。

在文献中,经常发现通过随机选择位置来生成负训练样本的方法。我还看到了一些方法,其中在选择随机负样本的连续步骤中,检测的误报再次用作负训练样本。但是,我想知道是否不能从一开始就普遍使用这种方法。因此,我们只会随机生成一个错误的训练样本,运行检测并将误报再次放入负训练集中。这对我来说似乎是一个很明显的策略,但我想知道我是否遗漏了什么。

4

3 回答 3

3

对我来说,听起来你想在线/增量地训练 SVM 分类器,即用新样本更新分类器。此类方法通常仅在随着时间的推移出现新数据时才使用。在您的情况下,您似乎可以生成一整套负训练样本,因此无需增量训练。我倾向于说一次训练分类器会比增量训练更好(正如 larsmans 所暗示的那样)。

于 2012-08-01T14:53:28.760 回答
3

该方法背后的理论在P. Felzenszwalb、R. Girshick、D. McAllester、D. Ramanan 在他们的 PAMI 论文中的基于判别训练的基于部件的模型的目标检测中进行了阐述。本质上,您的起始负集无关紧要,如果您迭代地添加硬样本(SVM 边距 > -1),您将始终收敛到同一个分类器。从单个否定开始只会使这种收敛速度变慢。

于 2012-08-02T10:31:31.660 回答
0

(再说一次,我不是图像处理专家,所以对此持保留态度。)

我想知道是否不能从一开始就普遍使用这种方法。

您需要某种方法来检测分类运行中的误报。为此,您需要一个基本事实,也就是说,您需要一个人参与其中。实际上,您将进行主动学习。如果这就是你想要做的,你也可以从一堆手工标记的负面例子开始。

或者,您可以将其设置为PU 学习问题。我不知道这是否适用于图像,但对于文本分类,它有时会起作用。

于 2012-08-02T09:43:01.690 回答