我正在使用 Python 开发基于语音的个人助理。我从一些开源项目中获得了帮助。我有用于文本引擎语音的 api。我的助手首先录制语音,然后使用 api 发送语音并返回转录的命令。而其他平台,如 siri、cortana、google now、houndify 和网络服务,它们是实时的,就像即时一样。
如何实现像这些引擎一样的即时语音到文本?
我正在使用 Python 开发基于语音的个人助理。我从一些开源项目中获得了帮助。我有用于文本引擎语音的 api。我的助手首先录制语音,然后使用 api 发送语音并返回转录的命令。而其他平台,如 siri、cortana、google now、houndify 和网络服务,它们是实时的,就像即时一样。
如何实现像这些引擎一样的即时语音到文本?
Houndify Python SDK 允许您从 Python 项目对 Houndify API 进行流式语音和文本查询。您可以使用 SDK 提供的 StreamingHoundClient 类进行语音查询,并在 Houndify 平台上启用相应的域以获得即时答案。虽然该平台能够将您的语音直接转换为意义,但如果您仍想获得录制音频的转录,您可以使用 Speech to Text 域。
这是关于如何设置它的文档的链接,这里是Python SDK 的链接。您必须登录才能访问文档并下载适用于 Python 2.7 或 Python 3.0 的 SDK。
这应该允许您进行查询并立即获得答案。