我们有两个人在不同频道上讲话的录音。我在这里尝试 node.js 的官方文档。首先,我收到一个错误,即有效负载大小超过了最大限制。
ubuntu@ip-xxxx:~/nodejs-docs-samples/speech$ node recognize.js async /home/ubuntu/output.wav
(node:18306) UnhandledPromiseRejectionWarning: Unhandled promise rejection (rejection id: 1): Error: Request payload size exceeds the limit: 10485760 bytes.
然而,该文档刚刚提到了记录长度方面的限制,而不是文件大小方面的限制。这是链接
有什么解决方法吗?
另外,我尝试使用较小的文件大小并得到配置错误:
ubuntu@ip-xxx:~/nodejs-docs-samples/speech$ node recognize.js async /home/ubuntu/output2.wav
(node:18291) UnhandledPromiseRejectionWarning: Unhandled promise rejection (rejection id: 1): Error: Invalid Configuration, Does not match Wav File Header.
Wav Header Contents:
Encoding: LINEAR16
Channels: 2
Sample Rate: 16000.
Request Contents:
Encoding: linear16
Channels: 1
Sample Rate: 16000.
我不确定 API 是否允许使用 2 通道音频输入,因为我在文档中找不到任何此类配置。但是,我发现了这个链接,建议将音频拆分为单独的通道并单独使用它们。以编程方式执行此操作的推荐方法是什么?