我使用 Node Red 开发了一组相当强大的工作流,用于与 Watson 工具集的各个部分进行交互。我想通过 Twilio 为他们创建一个语音电话接口,但我很难弄清楚我需要做什么才能访问实时音频源。
通过 Node-Red,Watson STT 需要:
Speech To Text 将人声转换为书面文字。该服务使用机器智能将有关语法和语言结构的信息与音频信号组成的知识相结合,以生成更准确的转录
要分析的音频文件应该在 msg.payload 上传递。
支持的 msg.payload 类型:。
音频缓冲区原始音频字节的字符串 URL 音频必须是 WAV、FLAC 或 OGG 编码文件。
问题是这样的:我已经搜索了可编程语音的 API,但似乎没有成功找到我将启动的 API 调用以创建可以通过管道传输的音频流(通过 URL 或音频字节引用)进入 Watson STT。
任何比我更有经验的 Twilio 工具集有一些答案的人吗?