我正在开发一个识别音素的项目,以便能够识别某人是在说“是”还是“否”。
到目前为止,在项目中,我已经使用过零来识别这个人在说什么,这非常有效,而且看起来很容易理解。然而,该项目需要一些改进,并且必须使用隐马尔可夫模型进行开发。
我的问题是这样的:
我想开发一个隐马尔可夫模型,而不删除我已经完成的工作。即,我通过计算过零的数量以及块的总和来去除不值得考虑的数据。
我不明白我需要什么数据来训练 HMM 才能识别这些音素。例如
对于过零,我已经确定:
是 - 过零开始低,然后值增加
否 - 零交叉点从低位开始,然后不随值增加。
我可以训练我的 HMM 算法以便它解释这些值吗?
或者任何人都可以建议一种方法,我可以训练 HMM 以识别样本中输入的单词?
希望有人可以提供帮助:)!