2

所以首先,我试图从一张乐谱上检测音乐符号。假设,在这种情况下,我们在这张表http://www.anzacday.org.au/中寻找 gclef http://upload.wikimedia.org/wikipedia/commons/f/ff/GClef.svg杂项/lastpost.gif

对于正样本,我使用了一个谱号图像并将其旋转到我需要的角度,以涵盖所有可能的形状,即从一本书到另一本书的变化。2000 个样本,在 haartrainer 中使用 1500 个。

对于负样本,我下载了 3019 张随机图像并正在使用它们,当然检查它们都没有 gclef 符号。负面图像是云、办公室、房屋、建筑物、树木、笔记本电脑。实际上我在stackoverflow上找到了一个链接,请不要让我去寻找它......使用3018个负样本。

负样本重要吗?即,如果我的负样本是云和房屋,我会得到比没有谱号的乐谱更清晰的结果吗?即负样本会影响物体检测吗?我已经创建了两个具有 10-14 个阶段的级联文件,我得到了非常不同的结果。但是通过裁剪乐谱来创建 3000 个负样本是一件很痛苦的事情……

我的对象检测器不打算在野外工作,而只能在扫描的乐谱上工作,所以它唯一会遇到的就是音乐符号......如果 Haartraining 不是办法,请指出!完成n00b,只是想办法。

4

3 回答 3

4

如果您不期待房屋、树木和汽车,为什么要将它们用于负样本?更好地使用实际出现在要分析的图像中的图像补丁。例如,低音谱号更接近于 ag 谱号,而不是树形补丁。实际上,您图像上的几乎每个符号都更接近于谱号而不是真实世界的图像,因为您的真实世界不是位图样式。

您是否在一次训练中使用了不同的谱号旋转方式?不要这样做!Haar 训练不是旋转不变的。如果您希望您的工作表被旋转,您应该更好地旋转图像并为每个旋转的图像运行检测。

或者...您可以通过检测线条(例如使用霍夫线)来检测纸张的方向,仅将其旋转一次以获得直立图像,然后运行检测。

您可以从几个样本开始进行测试(假设 10 个阳性,100 个阴性)。训练不会花那么长时间。g谱号应该很容易训练,因为它很有特点。如果您发现它朝着正确的方向发展,您可以添加样本以改进检测器的质量。

祝你好运!:)

btw.:你是小号手吗?;)

于 2012-11-07T09:05:21.773 回答
3

是的,否定确实很重要,您应该在可能的最佳条件下训练您的分类器,即在预测期间使用您将给出的图像,即乐谱的图像。因此,将没有 g-clef 的乐谱中提取的图像作为负样本。您仍然可以将其他类型的图像添加到负片集中。

于 2012-11-07T08:53:03.950 回答
1

这是一组负面图像: http ://tutorial-haartraining.googlecode.com/svn/trunk/data/negatives/

于 2013-04-13T11:51:20.137 回答