我研究了 Google Cloud Speech API,并让我的麦克风在 Node 服务器上工作。
然后我想知道从网络前端流式传输麦克风的最佳做法是什么?它是否将音频流从 getUserMedia 发送到 Node 服务器并使用 Node API 客户端将其通过管道传输到 API?还是只是将语音输入保存到我然后传输到 API 的文件中?
目的是“转录”指令(一两句话长)并将结果发送到另一个 API。
我研究了 Google Cloud Speech API,并让我的麦克风在 Node 服务器上工作。
然后我想知道从网络前端流式传输麦克风的最佳做法是什么?它是否将音频流从 getUserMedia 发送到 Node 服务器并使用 Node API 客户端将其通过管道传输到 API?还是只是将语音输入保存到我然后传输到 API 的文件中?
目的是“转录”指令(一两句话长)并将结果发送到另一个 API。
我知道这个问题已经存在一年多了,OP 可能已经找到答案或放弃了,但我花了足够长的时间徒劳地尝试谷歌搜索,然后才发现我想帮助任何追随我的人: 我在这里写了一个教程来解决这个问题。