image-recognition - 开源对象识别算法

Question

我一直在对用于我的对象识别程序的正确算法进行大量搜索。但我发现的所有东西都有一些重大缺陷。

我的程序应该在遇到新对象时在线学习它们。当它遇到一个新对象时，会在其上设置一个框并学习该对象（OpenTLD 完美地做到了这一点）。对不同的对象重复这 1000 次，程序应该能够识别 1000 次对象的类和实例（类似 Haar 的特征级联可以做到这一点，OpenTLD 失败）。该算法必须是尺度和方向不变的（Haar 失败）。

我发现的所有东西都只能满足上述一些标准，而其他标准则不合格。令人惊讶的是，我还没有遇到任何可以满足所有标准的东西。我只在上面提到了 Haar 和 OpenTLD，因为它们是最接近我需要的。其他算法，如 SIFT、SURF 离我需要的更远。

所以我的问题是，是否有任何现有的源代码可以满足我的需要？或者，如果只是修改现有的源代码，我会有更好的运气吗？

score 4 · Accepted Answer

TLD 和 Kalal 的工作非常适合跟踪。然而，识别是一个非常不同的问题。

我不明白你为什么解雇 SIFT 或 SURF 以获得认可。我肯定会朝那个方向看。定向梯度直方图（HoG）（维基百科）是一个相关的算法家族，被认为是最先进的。例如，它在许多 ICIP'11 论文中以一种或另一种形式使用。

您要问的问题在计算机视觉中仍然是一个未解决的问题。您不会找到太多现成的代码。研究代码（例如 Matlab），用于非商业用途，是的，但您可能需要对其进行大量修改/优化以供实际使用。Pongr、Kooaba、IQEngines 等一些公司提供用于对象识别的在线 API。

image-recognition - 开源对象识别算法

1 回答 1

Related

Reference