5

我目前正在开发一个手语识别应用程序,我想使用隐马尔可夫模型作为分类阶段,这意味着我将对手势/姿势进行分类以获得相关的字母或单词。

我目前已经完成了检测手的第一阶段。目前,我可以获得一些可用于机器学习阶段的参数(特征),例如:

  • 手凸包
  • 凸面缺陷
  • 手心
  • 包围旋转的椭圆/矩形(例如获得旋转所需的任何角度)
  • 手的轮廓
  • 时刻(我不确定这些到底是什么)

这些都可以通过 openCv 完成。

我的问题:一旦我拥有了所有这些特征,我该如何执行“特征提取”阶段?即,如果机器学习算法,在这种情况下 HMM 需要一组概率,我该如何使用上述信息?

我的一个想法是创建一个特殊的数据结构,其中包含唯一标识每个手势的此类信息,但我如何将其提供给机器学习技术?(在这种情况下是隐马尔可夫模型)

谁能指导我在这个特定阶段至少应该寻找什么,或者指导我展示我真正遇到的困难是什么?

4

1 回答 1

5

准备好一组观察结果后,您可以将其输入维特比算法,以检测可能产生这些观察结果的最佳状态序列。此外,您可以使用 Baum-Welch 算法在样本数据集上训练您的 HMM。你可以看看我的博客文章,它是使用 HMM 识别动态手势的简单解释(尽管我没有使用 openCV 或扫描手的轮廓)。希望这可以帮助您大致了解处理和学习阶段。

于 2013-04-22T11:52:01.253 回答