Google Chrome 提供语音转文本 (STT),许多智能手机应用程序都提供 STT。它有很好的认可度。
我想要 Visual Studio(MFC) 中的程序,但是没有办法做 STT。如果我使用 Google Speech To Text Api,很容易解决这个问题。
如果没有关于 STT 的公共 google api,请告诉我另一种方法,除了 start。
Google Chrome 提供语音转文本 (STT),许多智能手机应用程序都提供 STT。它有很好的认可度。
我想要 Visual Studio(MFC) 中的程序,但是没有办法做 STT。如果我使用 Google Speech To Text Api,很容易解决这个问题。
如果没有关于 STT 的公共 google api,请告诉我另一种方法,除了 start。
据我所知,Google 没有记录他们的语音 API,也不打算将其用于通用客户端。我相信他们的意图是让语音 API 支持他们的 Android 和 Chrome 产品。也就是说,是否有人在生产中使用 Google Speech API?谷歌的语音识别技术有 API 吗?.
既然您正在为 Windows 编程,为什么不使用内置的 Windows 语音引擎。您可以使用 .Net 或 Microsoft.Speech 的 System.Speech 功能并安装 Microsoft 提供的免费识别器。Windows 7 包括一个完整的语音引擎。其他的可以免费下载。有一个用于相同引擎的 C++ API,称为 SAPI。请参阅http://msdn.microsoft.com/en-us/magazine/cc163663.aspx。或http://msdn.microsoft.com/en-us/library/ms723627(v=vs.85).aspx。有关 Windows 的 Microsoft 引擎的更多背景信息 System.Speech.Recognition 和 Microsoft.Speech.Recognition 有什么区别?
我希望最后一个链接对您有所帮助,这是 .NET 中语音识别的一个简单示例 - SAPI 和 Windows 7 问题
您可能会发现:https ://gist.github.com/alotaiba/1730160很有用。基本上,您需要在 POST 请求中将 FLAC 编码的音频文件发送到谷歌服务器。请注意,它只接受 15 秒以内的音频文件(对于简单的语音命令应用程序就足够了)。
我正在研究这样的事情,MS Speech API 不适合我,即使它很好,因为它不支持 Google API 支持的大多数语言(例如波兰语,MS 文本到语音的相同)。