我正在做我最后一年的项目,即语音识别。但我不知道如何开始。我将使用 c#。请问谁能指导我如何开始?第一步应该是什么?
谢谢
您可能想从这里的语音识别维基百科条目开始:http ://en.wikipedia.org/wiki/Speech_recognition - 在该文章的末尾,有许多有用的链接指向有关该主题的论文和软件。
您要做的另一件事是与正在协调该项目的教授交谈。他或她将了解其他资源,并可能为您指明一个好的方向。
另外——无论何时开始一个你一无所知的项目,谷歌都是你的朋友
语音识别实际上是模糊模式匹配,那么看看人工神经网络怎么样,因为它们非常擅长模式匹配。确保音频采用简单的格式并修剪为音节/单词。在这些文件上训练网络,然后找到一种方法来拆分您在代码中记录的文件。从非常有限的词汇(可能是单个字母)开始作为概念证明可能是最简单的。准备通宵运行计算机以训练网络并尝试访问高性能集群。
我会首先研究一些图书馆并阅读这些主题。
http://www.microsoft.com/speech/evaluation/thirdparty/engines.mspx
http://www.codeproject.com/KB/audio-video/TTSinVBpackage.aspx
http://blogs.msdn.com/coding4fun/archive/2006/10/31/909044.aspx
您可以查看 .Net System.Speech.Recognition 命名空间:
http://msdn.microsoft.com/en-us/library/system.speech.recognition.aspx
看看这篇 MSDN 文章,它描述了 Windows Vista 和 Windows 7 中内置的语音库:http: //msdn.microsoft.com/en-us/magazine/cc163663.aspx