我目前正在开发一个手语识别应用程序,我想使用隐马尔可夫模型作为分类阶段,这意味着我将对手势/姿势进行分类以获得相关的字母或单词。
我目前已经完成了检测手的第一阶段。目前,我可以获得一些可用于机器学习阶段的参数(特征),例如:
- 手凸包
- 凸面缺陷
- 手心
- 包围旋转的椭圆/矩形(例如获得旋转所需的任何角度)
- 手的轮廓
- 时刻(我不确定这些到底是什么)
这些都可以通过 openCv 完成。
我的问题:一旦我拥有了所有这些特征,我该如何执行“特征提取”阶段?即,如果机器学习算法,在这种情况下 HMM 需要一组概率,我该如何使用上述信息?
我的一个想法是创建一个特殊的数据结构,其中包含唯一标识每个手势的此类信息,但我如何将其提供给机器学习技术?(在这种情况下是隐马尔可夫模型)
谁能指导我在这个特定阶段至少应该寻找什么,或者指导我展示我真正遇到的困难是什么?