0

我想开始使用基于语音识别的 Prototype中的语音识别和语音合成 有人告诉我使用微软语音服务器(sdk 等)

当我有这个时,我如何对应用程序进行编程,以及使用哪种编程语言(开发环境?)?

有人使用星号或 SVOX 吗?

我需要去做:

语音识别语音合成

我不必是一个非常好的语音识别 - 我认为 30 -50 个单词应该足够开始了。我正在使用 Windows。

提前致谢

4

2 回答 2

2

如果您选择使用 Microsoft 语音引擎,则有 .NET 框架 API。正如我在另一篇文章中提到的,有两个命名空间(System.Speech 用于桌面,Microsoft.Speech 用于服务器)。您可以使用任何 .NET 语言进行编程,并且可以使用 Visual Studio。

几年前在http://msdn.microsoft.com/en-us/magazine/cc163663.aspx上发表了一篇非常好的文章。这可能是迄今为止我发现的最好的介绍性文章。但是,它基于 WinFX API 的预发布版本,并且在 Vista 发布时更改了 System.Speech 类。由于这些破坏性的 API 更改,本文中的示例无法编译,我没有找到任何更新或勘误表来解释这一点。在 Internet 上搜索方法名称“AppendResultKeyValue”,您会发现一些论坛帖子,例如http://www.ms-news.net/f3012/system-speech-break-changes-3025734.html,人们在其中遇到了这个问题同样的问题。

它仍然是一篇很好的介绍性文章,值得一读。稍加修改,您就可以让示例应用程序正常工作。

于 2010-10-07T13:49:19.230 回答
0

当我学习计算语言学时,选择的工具是Praat,这是一个非常混乱的原型设计工具,可以让你做任何与语音相关的事情。

我不认为它有任何外部 API,但它的内部脚本语言对于初级应用程序来说已经足够了,而且它有很多内置函数。对于理论和算法的“入门”来说,还不错。

于 2010-10-07T11:32:08.547 回答