如何在.NET中实现语音识别?
我有一堆.mp3
计算机生成的声音质量相对较高的 s。在每个.mp3
声音中,都会说出一些随机文本,然后是一系列 6-7 位英文数字。我想将这些数字提取为文本。
是否可以在.NET 中实现这样的事情?
如何在.NET中实现语音识别?
我有一堆.mp3
计算机生成的声音质量相对较高的 s。在每个.mp3
声音中,都会说出一些随机文本,然后是一系列 6-7 位英文数字。我想将这些数字提取为文本。
是否可以在.NET 中实现这样的事情?
这是System.Speech.Recognition 命名空间的链接,可以帮助您。
使用语音识别时,最好的办法是在 Windows Vista 或 Windows 7 中工作,因为它们具有 Microsoft SAPI(语音 API)5.3(并且很快将具有 5.4),与 Windows XP 的 SAPI 5.1 相比,这在性能上有很大差异。
现在,这里有一个应用程序的视频和源代码(它是 c++,但您可以将其传递给另一种语言),几乎可以满足您的需求。
为了更好地识别单词,他们用他们想要识别的单词制作了一个语法文件。你可以看到那个视频,你会发现制作你想要的东西很容易。
祝你好运!
您可以使用 Microsoft SAPI SDK:
http
://www.microsoft.com/downloads/details.aspx?FamilyID=5e86ec97-40a7-453f-b0ee-6583171b4530&DisplayLang=en查看 SAPI SDK 中的 C# 示例。
您可以使用 Microsoft Speech to text Engines.. 它易于使用
这里有一些样本