4

我一直在对用于我的对象识别程序的正确算法进行大量搜索。但我发现的所有东西都有一些重大缺陷。

我的程序应该在遇到新对象时在线学习它们。当它遇到一个新对象时,会在其上设置一个框并学习该对象(OpenTLD 完美地做到了这一点)。对不同的对象重复这 1000 次,程序应该能够识别 1000 次对象的类和实例(类似 Haar 的特征级联可以做到这一点,OpenTLD 失败)。该算法必须是尺度和方向不变的(Haar 失败)。

我发现的所有东西都只能满足上述一些标准,而其他标准则不合格。令人惊讶的是,我还没有遇到任何可以满足所有标准的东西。我只在上面提到了 Haar 和 OpenTLD,因为它们是最接近我需要的。其他算法,如 SIFT、SURF 离我需要的更远。

所以我的问题是,是否有任何现有的源代码可以满足我的需要?或者,如果只是修改现有的源代码,我会有更好的运气吗?

4

1 回答 1

4

TLD 和 Kalal 的工作非常适合跟踪。然而,识别是一个非常不同的问题。

我不明白你为什么解雇 SIFT 或 SURF 以获得认可。我肯定会朝那个方向看。定向梯度直方图(HoG)(维基百科)是一个相关的算法家族,被认为是最先进的。例如,它在许多 ICIP'11 论文中以一种或另一种形式使用。

您要问的问题在计算机视觉中仍然是一个未解决的问题。您不会找到太多现成的代码。研究代码(例如 Matlab),用于非商业用途,是的,但您可能需要对其进行大量修改/优化以供实际使用。Pongr、Kooaba、IQEngines 等一些公司提供用于对象识别的在线 API。

于 2012-03-18T13:08:20.487 回答