我有一组简单的刚性 3D 对象,我希望从图像中检测和识别(比如说 5 到 10 个类)。物体在某种意义上很简单,它们是一种颜色的圆柱体或具有简单图案(例如条纹)或类似简单形状的矩形。这些对象彼此之间有很大的不同(例如,没有两个类,其中一个是大圆柱体,另一个是相同但较小的圆柱体)。因为纹理非常简单(实体和/或简单图案),所以词袋方法失败了(它们不包含大量独特的边缘)。
虽然一种可能的方法是手动编码每个分类器(手动特征提取等),但是否有一种简单的数据驱动方法(例如 Haar/LBP 分类器)可以工作?如果 Haar 或 LBP 可以很好地解决这个问题,那么如何解决未知相对视点的问题(以及通过这种透视失真、旋转等)?只是从所有可能的角度为一个对象提供正图像会收敛还是通常会做其他事情?检测和识别应该实时运行。