0

我想创建一个声音识别系统。系统一旦被训练应该能够识别相似的声音。例如,我的声音很少,例如淋浴、冲水马桶、火灾警报。我会把系统安装在一个公寓里,并用这些声音训练它。然后,当系统安装在不同的公寓中时,系统应该能够识别这些声音,这些公寓的淋浴声、冲水马桶声和火灾警报声的频谱略有不同。那可能吗?可以使用哪些技术?我在想诸如隐藏马尔可夫模型、神经网络之类的语音识别技术?

4

4 回答 4

2

您正在寻找模式识别算法。例如,我相信PCA可以成为一种解决方案。您首先提取训练样本的频谱特征。然后 PCA 会将新声音分类为最接近的已知样本。

于 2012-04-23T18:08:49.127 回答
0

除了提到的模式识别/机器学习解决方案之外,您可能还应该看看Dynamic Time Warping

于 2012-04-24T00:02:20.090 回答
0

FFT 是你的朋友。本文将为您提供一些曲目。

于 2012-04-23T09:40:21.473 回答
0

如果您有兴趣通过神经网络来做这件事,我建议您首先阅读有关神经网络的文献。此外,可以在此处找到有关神经网络语音识别的一些有用说明

基本上这是可以在此链接下载的软件的用户指南

我自己没有使用过该软件,但我相信他们也提供了源代码。希望有帮助。

编辑:还添加了一些来自代码项目的源代码,这些源代码在神经网络上实现反向传播算法。看看这里

于 2012-04-23T09:39:21.650 回答