这个问题与传统的手写识别有点不同。我有一个数以千计的数据集。对于一个绘制的字符,我有几个(x, y)
按下笔的顺序坐标。因此,这是一个顺序(时间)问题。
我希望能够根据这些数据对手写字符进行分类,并希望实现 HMM 以用于学习目的。但是,这是正确的方法吗?他们怎么能被用来做到这一点?
这个问题与传统的手写识别有点不同。我有一个数以千计的数据集。对于一个绘制的字符,我有几个(x, y)
按下笔的顺序坐标。因此,这是一个顺序(时间)问题。
我希望能够根据这些数据对手写字符进行分类,并希望实现 HMM 以用于学习目的。但是,这是正确的方法吗?他们怎么能被用来做到这一点?
我认为 HMM 可以用于@jens 提到的两个问题。我也在做在线手写,很多文章都使用了 HMM。最简单的方法是这样的:
对于每个项目:
这个问题实际上是两个问题的混合:
HMM 用于从噪声测量中找到有限数量的离散状态的最可能序列。这正是问题 2,因为离散状态 az,0-9 的噪声测量按顺序相互跟随。
对于问题 1,HMM 是无用的,因为您对底层序列不感兴趣。你想要的是用你如何写它的信息来增加你的手写数字。
就我个人而言,我会从实现常规的最先进的手写识别开始,这已经非常好(使用卷积神经网络或深度学习)。之后,您可以添加有关其编写方式的信息,例如顺时针/逆时针。