我想创建一个应用程序,它可以学习对用户绘制的一系列点进行分类,例如手写识别。如果数据点由许多 (x,y) 对组成(例如对应于手势实例的像素),那么计算该实例的最佳特征是什么,这将构成一个好的多类分类器(例如 SVM, NN等)?特别是如果提供的培训示例有限。
问问题
640 次
1 回答
1
如果我是你,我会找到与角点、端点和交叉点相对应的数据点,将它们用作特征并丢弃中间点。您也可以包含这些兴趣点的角度或其他一些描述符。
为了检测兴趣点,您可以使用Harris 检测器,然后您可以使用该点的梯度值作为简单的描述符。或者,您可以使用更花哨的方法,例如SIFT。
您可以使用下采样图像中每个像素的描述符,然后使用 SVM 进行分类。这样做的缺点是特征向量中会有大量无趣的数据点。
另一种方法是不将其视为分类问题,而是将其视为模板匹配问题(在计算机视觉中相当常见)。在这种情况下,可以将手势指定为任意数量的兴趣点,完全忽略不感兴趣的数据。实例点的某个阈值百分比必须与模板匹配才能进行肯定识别。例如,当匹配'R'实例的角点与'X'模板时,右下点应该匹配,是相同位置方向的端点,但其他点太不相似,给出了相当低的分数和标识 R=X 将被拒绝。
于 2012-06-17T12:33:57.650 回答